Batch Normalization批标准化是什么? | BN有啥用 | Batch Normalization是什么

举报
王博Kings 发表于 2020/12/30 01:24:20 2020/12/30
【摘要】 今天不讲原理了,我感觉写一大堆,让大家也理解不透 简要说一下: 不仅仅极大提升了训练速度,收敛过程大大加快;还能增加分类效果,一种解释是这是类似于Dropout的一种防止过拟合的正则化表达方式,所以不用Dropout也能达到相当的效果;另外调参过程也简单多了,对于初始化要求没那么高,而且可以使用大的学习率等。  在网上还找到一些比较不错的图,可以启发 数据做预处理 可以...

今天不讲原理了,我感觉写一大堆,让大家也理解不透

简要说一下:

  • 不仅仅极大提升了训练速度,收敛过程大大加快;
  • 还能增加分类效果,一种解释是这是类似于Dropout的一种防止过拟合的正则化表达方式,所以不用Dropout也能达到相当的效果;
  • 另外调参过程也简单多了,对于初始化要求没那么高,而且可以使用大的学习率等。

 在网上还找到一些比较不错的图,可以启发

数据做预处理
可以用 normalization 归一化 ,或者 standardization 标准化,
用来将数据的不同 feature 转换到同一范围内,
normalization 归一化 :将数据转换到 [0, 1] 之间,
standardization 标准化:转换后的数据符合标准正态分布



为什么要做归一化和标准化?

 不同的特征具有不同数量级的数据,它们对线性组合后的结果的影响所占比重就很不相同,数量级大的特征显然影响更大。

文章来源: kings.blog.csdn.net,作者:人工智能博士,版权归原作者所有,如需转载,请联系作者。

原文链接:kings.blog.csdn.net/article/details/109390059

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。