《Python深度学习实战:基于TensorFlow和Keras的聊天机器人》 —3.3 多层感知机

举报
华章计算机 发表于 2020/02/13 22:05:47 2020/02/13
【摘要】 本节书摘来自华章计算机《Python深度学习实战:基于TensorFlow和Keras的聊天机器人》 一书中第3章,第3.3节,作者是[印] 纳温·库马尔·马纳西(Navin Kumar Manaswi),刘毅冰 薛 明 译。

3.3 多层感知机

多层感知机(MLP)是一个反馈人工神经网络的简单例子。一个MLP除输入、输出层之外,还至少有一个带节点的隐层。除了输入层之外,层的每个节点都被称为神经元(它使用非线性激活函数,比如Sigmoid或者ReLU)。MLP使用叫作反向传播的监督学习技术来训练,同时最小化损失函数,比如交叉熵。它使用优化器来调优参数(权重值和偏置量)。MLP的多个层以及非线性激活是区分其和线性感知机的关键。

多层感知机是深度神经网络的基本形式。

在学习MLP之前,我们先考察线性模型和逻辑斯谛模型。你能够领会到线性、逻辑斯谛以及MLP模型在复杂性方面的细微差别。

图3-3展示了一个具有一个输入(X)和一个输出(Y)的线性模型。

 image.png

图3-3 单输入向量

单输入的模型具有一个向量X并带有权重值W和偏置量b。输出Y(也即WX+b)是一个线性模型。

图3-4展示了多个输入(X1和X2)和一个输出(Y)。

 image.png

图3-4 线性模型

线性模型具有X1和X2两个输入特征及其对应权重值W1、W2和偏置量b。输出Y,也即W1X1+W2X2+b。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。