防止过拟合(二):Dropout

举报
AI 菌 发表于 2021/08/05 01:05:27 2021/08/05
【摘要】 深度学习笔记:欠拟合、过拟合 防止过拟合(一):正则化 防止过拟合(三):数据增强 Dropout 在 2012 年,Hinton 等人在其论文《Improving neural networks by preventing co-adaptation of feature detectors》中使用了 Dropout 方法来提高模型性能。Dropout通过随机断开...

深度学习笔记:欠拟合、过拟合
防止过拟合(一):正则化
防止过拟合(三):数据增强

Dropout

在 2012 年,Hinton 等人在其论文《Improving neural networks by preventing co-adaptation of feature detectors》中使用了 Dropout 方法来提高模型性能。Dropout通过随机断开神经网络之间的连接,减少每次训练时实际参与计算的模型的参数量,从而减少了模型的实际容量,来防止过拟合。

但是需要注意的是:在测试时,Dropout 会恢复所有的连接,保证模型测试时获得最好的性能。

示意图

在这里插入图片描述
图(a)是标准的全连接神经网络,当前节点与前一层的所有输入节点相连。
图(b)是添加dropout功能的网络,按照概率随机断开神经网络的连接线。图中虚线代表了采样结果为断开的连接线,实线代表了采样结果不断开的连接线。

TensorFlow2.0中实现dropout

1.可以通过 tf.nn.dropout(x, rate)函数实现某条连接的 Dropout 功能,其中rate表示断开的概率值。

# 添加dropout操作
x = tf.nn.dropout(x, rate=0.5)

  
 
  • 1
  • 2

2.也可以将Dropout作为一个网络层使用,在网络中间插入一个 Dropout 层

# 添加dropout层
model.add(layers.Dropout(rate=0.5))

  
 
  • 1
  • 2

实验效果

为了验证 Dropout 层对网络训练的影响,我们在维持网络层数等超参数不变的条件下,通过在 5 层的全连接层中间隔插入不同数量的 Dropout 层来观测 Dropout 对网络训练的影响。
在这里插入图片描述

从上图可以看到,在不添加 Dropout 层时,网络模型出现了明显的过拟合现象;随着 Dropout 层的增加,网络模型训练时的实际容量减少,泛化能力变强。

文章来源: ai-wx.blog.csdn.net,作者:AI 菌,版权归原作者所有,如需转载,请联系作者。

原文链接:ai-wx.blog.csdn.net/article/details/104857877

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。