《Python深度学习实战:基于TensorFlow和Keras的聊天机器人》 —3.3 多层感知机
【摘要】 本节书摘来自华章计算机《Python深度学习实战:基于TensorFlow和Keras的聊天机器人》 一书中第3章,第3.3节,作者是[印] 纳温·库马尔·马纳西(Navin Kumar Manaswi),刘毅冰 薛 明 译。
3.3 多层感知机
多层感知机(MLP)是一个反馈人工神经网络的简单例子。一个MLP除输入、输出层之外,还至少有一个带节点的隐层。除了输入层之外,层的每个节点都被称为神经元(它使用非线性激活函数,比如Sigmoid或者ReLU)。MLP使用叫作反向传播的监督学习技术来训练,同时最小化损失函数,比如交叉熵。它使用优化器来调优参数(权重值和偏置量)。MLP的多个层以及非线性激活是区分其和线性感知机的关键。
多层感知机是深度神经网络的基本形式。
在学习MLP之前,我们先考察线性模型和逻辑斯谛模型。你能够领会到线性、逻辑斯谛以及MLP模型在复杂性方面的细微差别。
图3-3展示了一个具有一个输入(X)和一个输出(Y)的线性模型。
图3-3 单输入向量
单输入的模型具有一个向量X并带有权重值W和偏置量b。输出Y(也即WX+b)是一个线性模型。
图3-4展示了多个输入(X1和X2)和一个输出(Y)。
图3-4 线性模型
线性模型具有X1和X2两个输入特征及其对应权重值W1、W2和偏置量b。输出Y,也即W1X1+W2X2+b。
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)