- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

使用反向传播算法（back propagation）训练多层神经网络

举报

xindoo 发表于 2022/04/15 23:49:58 2022/04/15

【摘要】　　本文翻译自http://galaxy.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html，大概介绍下反向传播的基本原理。　　本文旨在描述反向传播算法在多层神经...

　　本文翻译自http://galaxy.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html，大概介绍下反向传播的基本原理。
　　本文旨在描述反向传播算法在多层神经网络训练中的过程，为了直观描述此过程，我们用到了包含两个输入和一个输出的三层神经网络，如下图所示：
　　

　　每个神经元由两个单元组成。第一单元把权重和输入信号的积相加，第二单元是被称为神经元激活函数的非线性函数。信号e是第一单元的输出信号，而y＝f(e)是非线性函数的输出信号。信号y也是神经元的输出信号。

　　我们需要训练数据集来训练神经网络，训练数据包含输入信号（x1和x2）和相应的目标结果z组成。神经网络训练是个迭代的过程。在每次迭代中，每个节点的权重系数根据训练数据做出修正.
　　修正算法描述如下：每步训练都是从训练数据集中取两个输入信号开始，此阶段结束后，我们就可以确定每层神经网络中每个神经元的输出信号。下图展示了信号如何在神经网络中传播，符号w(xm)表示网络中输入值xm和神经元n之间连接的权重，yn表示神经元n的输出信号。

　　信号的传播通过隐藏层。符号wmn表示输出神经元m和下一层输入神经元n之间链接的权重。

　　信号传播通过输出层。

　　在算法下一步中，神经网络的输出信号y会和来自训练集中的预期输出值（目标值）做比较，其差值被称为输出神经元的误差信号d。

　　我们不可能直接计算出内部神经元的误差信号，因为那些神经元的输出值是未知的。多年以来，我们一直没找到有效的多层神经网络的训练方法，只有上个世纪80年代的反向传播算法独树一帜。其思想是把训练误差 d 传递给那些处理输入信号得到输出信号的神经元。

　　权重系数wmn 被用来反向传递误差值，只从数据流方向传递误差（误差从接受信号的节点传递给产生信号的节点），此方法适用于所有的神经元节点。如果误差来自多个神经元，则该节点收到的所有误差做累加。过程如下图所示。

　　当每个神经元的误差被计算完成后，每个输入节点的神经元权值系数可能被调整。我们用公式df(e)/e 表示神经元激活函数的导数（用来修改权重系数）。

　　系数h 表示神经网络的学习速率。有几种选择参数的方法，第一种，初始较大的参数值，当权重关系逐渐建立起来的时候参数也会逐渐减小。第二种稍微复杂些，从小参数开始训练，训练过程中随着训练进度参数逐渐增大，然后在最终阶段减小。从小参数开始训练可以确定权重系数的符号。

References
Ryszard Tadeusiewcz “Sieci neuronowe”, Kraków 1992

文章来源: xindoo.blog.csdn.net，作者：xindoo，版权归原作者所有，如需转载，请联系作者。

原文链接：xindoo.blog.csdn.net/article/details/75579215

【版权声明】本文为华为云社区用户转载文章，如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

评论（0）

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长