一文理解什么是深度学习?
自从AlphaGo在2016年以4:1战胜韩国选手李世石后,人工智能这个名词被人们所熟知。人工智能就是利用计算机模拟人类的思考方式实现类似人类的智能。
人工智能的实现方式很多,其中最常用的就是机器学习。1997年卡内基梅隆大学的Tom Michael Mitchell教授给出的机器学习定义是:“如果一个程序可以在任务T上,随着经验E的增加,效果P也可以随之增加,则称这个程序可以从经验中学习”。
传统的机器学习在前些年是比较火的,但是在2012年AlexNet击败了传统的机器学习算法,赢得ImageNet比赛的冠军之后,深度学习的热度就超越了机器学习。深度学习几乎和深层神经网络是等价的,维基百科把深度学习定义为:“一类通过多层非线性变换对高复杂性数据建模算法的集合”。
一句话总结就是:人工智能包含机器学习,机器学习包含深度学习。
深度学习的发展过程可谓一波三折,在1943年第一个人工智能模型就被提出了,感知机也在1958年被发明。感知机相当于一个只有输入层和输出层的神经网络,由于这个网络的结构过于简单,不能解决线性不可分问题,使得这个模型并没有什么太大的用处,于是深度学习进入第一个寒冬。
20世纪80年代,更多层次的神经网络被发明了,深层的神经网络可以很好地解决线性不可分问题。到了20世纪90年代,传统的机器学习比深度学习的准确率更高,而且训练的时间更短。在那个算力非常匮乏的年代,大多数学者都把精力花在研究传统机器学习上面,于是深度学习进入了第二个寒冬。
到了2012年,随着大数据时代的到了,在互联网上获取海量数据成为可能,算力更强的GPU被发明,使得算力不再是阻碍深度学习发展的瓶颈。在这一年,AlexNet一举打败了所有的传统机器学习算法,获得了ImageNet比赛冠军,以16%的Top5错误率远超传统机器学习的26%Top5错误率。在之后的这几年比赛中,比赛的前20名都是使用了深度学习,传统机器学习基本也就退出了这个比赛。
深度学习一般分为3个领域:
1.计算机视觉
2.自然语言处理
3.语音识别
计算机视觉是深度学习应用的最早的领域,也是效果最好的领域,计算机视觉的应用一般有下面这几个方面:
1.图像识别
2.物体检测
3.OCR
深度学习在自然语言处理方面也有比较广泛的应用,主要有以下几个方面:
1.语言模型
2.机器翻译
3.实体识别
4.情感分析
5.词性标注
6.搜索排序
7.广告推荐
语音识别主要的应用方向有:
1.语音助手
2.语言识别
3.语音合成
4.语音翻译
- 点赞
- 收藏
- 关注作者
评论(0)