《深度学习:主流框架和编程实战》——1.2.2 基于统计的深度学习技术

举报
华章计算机 发表于 2019/06/04 19:27:58 2019/06/04
【摘要】 本书摘自《深度学习:主流框架和编程实战》——书中第1章,第1.2.2节,作者是赵涓涓、强彦。

1.2.2 基于统计的深度学习技术

最典型的基于统计的深度学习技术有受限玻耳兹曼机以及生成对抗式网络。

受限玻耳兹曼机(Restricted Boltzmann Machine,RBM)是一种可用随机神经网络来解释的概率图模型。随机神经网络的核心在于在网络中加入概率因素,而其中的随机是指这种网络中的神经元是随机神经元,其输出只有两种状态(0或1),而状态的取值根据概率统计的方法确定。RBM属于深度学习中常用的模型或方法,其结构如图1-2所示。

image.png

其中,下层为输入层,包括n个输入单元vn,用来表示输入数据;上层为隐藏层,包含m个隐藏层单元hm,RBM具有层内无连接、层间全连接的特征,这一特点可以保证RBM各层之间的条件独立性。

由于RBM为概率模型,而训练RBM网络的实质就在于能够使RBM所表达出的概率分布尽可能接近真实样本的分布。而实现这个目的RBM经典训练算法就是对比散度(Contrastive Divergence,CD)算法,即在每次训练过程中,以数据样本为初始值,通过Gibbs采样获取目标分布的近似采样,然后通过近似采样获得目标梯度,取得最终的结果。简单来说,统计学在受限玻耳兹曼机中的应用过程为对图像进行联合分布概率的描述,通过训练可以使RBM“学”到输入数据的统计规律,从而达到提取特征的目的。

RBM网络是以统计学为基础进行构建和训练的,是最典型的基于统计的深度学习技术。

生成对抗式网络(Generative Adversarial Networks,GAN)是一种新型网络,是由Goodfellow等人在2014年提出来的。其基本思想源自博弈论中的二人零和博弈,网络模型由一个生成网络和一个判别网络构成,生成网络用来学习样本的真实分布并用服从某一分布(高斯分布或均匀分布)的噪声生成新的数据分布,判别网络用来判别输入是真实样本还是生成网络生成的样本,通过生成网络与判别网络的对抗学习进行网络的训练。GAN的优化过程是极小极大博弈(Minimax game)问题,具体是指判别网络的极大化(即判别网络要尽可能区分真实样本和生成网络生成的样本)和生成网络的极小化,即生成网络生成的样本要尽可能“欺骗”判别网络,使其认为是真实的样本,优化目标为达到纳什均衡,使生成网络估测到数据样本的分布。GAN的计算流程与结构如图1-3所示。

image.png

图1-3 生成对抗式网络流程与结构

生成对抗式网络作为一种基于统计学的新型深度学习技术,通过模型学习来估测其潜在分布并生成同分布的新样本,被广泛应用于图像和视觉、语音与语言、信息安全等领域,如今许多研究者试图将其与强化学习结合进行进一步的研究。

作为深度学习的重要理论基础,未来统计学还有非常大的发展空间。因为深度学习模型具有较好的非线性函数表示能力,根据神经网络的通用近似理论(universal approximation theory)可知,对于任意的非线性函数一定可以找到一个深度学习网络来对其进行表示,但是“可表示”并不代表“可学习”,因此需要进一步了解深度学习的样本复杂度,即需要多少训练样本才能得到一个足够好的深度学习模型。这些问题都有待于从理论层面进行突破,统计学对深度学习的进一步发展有着十分重要的意义。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。