《Python数据挖掘与机器学习实战》—1.4 机器学习的应用
1.4 机器学习的应用
近几年的时间里,深度学习算法如雨后春笋般不断涌现。这些算法在计算机图像识别、语音和视频识别、自然语言处理及信息检索等领域不断刷新历史记录。本节将根据不同应用领域对相关的知名案例进行简述。
1.图像识别
图像识别过去依赖人工设置的特征,特别适合于提取低等级边界信息的SIFT(尺度不变特征转换)或HOG(方向梯度直方图)等。然而,随着小样本无法真实反映实际复杂的情况,研究人员开始在大数据集上进行实验。
1995年Yann Lecun设计了LeNet-5网络,该网络使用了2个卷积层、2个池化层和2个全连接层,形成典型的CNN(卷积神经网络),在MNIST数据集上的实验得到了0.9%的错误率,被用于银行手写支票识别。这也是CNN的成功案例之一。
2006年,Hinton用一个拥有3个隐藏层、170多万权重的深度置信网络在MNIST手写特征识别的数据集上进行训练,在没有对样本进行预处理的情况下,在1万条左右的测试集上,错误率为1.25%,低于反向传播网络及支持向量机(SVM)。
2011年,Google公司建立了全球最大的神经网络,即“深度神经网络”(DNN),也叫“谷歌大脑”,并进行了一个猫脸识别的实验。该实验从YouTube视频中取出1000万张静态图片,让系统自动学习并判断哪些是猫的图片。实验结果表明,他们所建立的深层网络及其算法,在ImageNet数据集1万张图中效果提升了15%,2.2万张图中效果提升了70%。该网络是一个用16000个CPU并行计算平台训练内部拥有10亿个节点的机器学习模型。
2016年初,谷歌旗下最强大脑(DeepMind)公司推出人工智能机器人AlphaGo,创下了围棋人工智能领域的诸多世界纪录。包括:在不让子的情况下,第一次在完整的围棋竞技中击败专业选手(比分5∶0);在中国围棋规则下,成功挑战围棋世界冠军李世石(比分4∶1)。AlphaGo的关键技术有深度学习、强化学习和蒙特卡洛树搜索。在其有监督学习策略和强化学习价值网络中采用了CNN结构。
2.语音识别
在过去,语音识别一直采用GMM-HMM模型。2012年,HinTon等人考虑了语音数据内部原有的结构特征以后,将传统的模型中的高斯混合模型GMM替换为DBN进行实验。结果表明,在TIMIT核心测试集上,错误率降到20.7%,准确率有明显提升。无独有偶,其他研究人员也尝试将GMM-HMM中的GMM替换为其他深度神经网络,也得到了良好的效果。
微软公司的语音视频检索系统(MAVIS),也是在CD-DNN-HMM深度模型的基础上进行开发的,其在RT03S数据集上单词错误率从27.4%降低到了18.5%。2012年,微软在天津公开演示了MAVIS系统对现场讲演者的英文演讲,进行后台的语音识别、英/中文机器翻译和中文语音合成等一系列处理,效果流畅。
3.自然语言处理
自然语言处理(NLP)传统处理方法的缺陷为采用浅层结构,使用线性分类器且需要人工设计大量较好的特征进行预处理,特征在分离的任务中被串联导致传播误差增大。2003年,Bengio等人提出词向量方法,采用神经网络构建语言模型。之后,研究人员在此基础上提出了不同的词向量训练模型。由于人类自然语言具有递归特性,即任何语言中的句子,事实上可以由词、短语递归组合而成,因此,将循环神经网络(RNN)引入NLP成为一种趋势。从2010年开始,来自Google的一些研究者一直从事该领域的研究,提出了RNNLM(循环神经网络语言模型),在语言模型的训练速度、准确率及困惑度上得到了改善。
4.医疗保健
退伍军人创伤后成长计划与IBM Watson合作使用人工智能和分析技术,以确保更多患有创伤后应激障碍的退伍军人能够完成心理治疗。使用这些技术后,使完成率从原来的不到10%上升到73%。根据退伍军人事务部的统计,80%的患有创伤后应激障碍的退伍军人在确诊后一年内完成治疗计划,得到康复。在参加了阿富汗和伊拉克战争的300万名老兵中,大约有五分之一的老兵患有创伤后应激障碍。
以色列医疗技术公司MedyMatch和IBM Watson Health正在使用人工智能,通过检测颅内出血,帮助医院急诊室的医生更有效地治疗中风和头部外伤患者。AI系统使用临床洞察力(clinical insight)、深度学习、患者数据和机器视觉来自动标记潜在的脑出血,以供医生检查。
用于检测和诊断癌症的传统方法包括计算机断层扫描(CT)、磁共振成像(MRI)、超声和X射线。不幸的是,许多癌症无法通过这些技术得到足够准确的诊断,从而及时地挽救生命。微阵列基因图谱的分析是一种替代方法,但这项技术需要很多小时的计算,除非这项技术可以使用AI替换。现在已经被证明,斯坦福大学的人工智能诊断算法可以与医疗团队(由21名经委员会认证的皮肤科医生组成)一样有效地从图像中检测潜在的皮肤癌。Startup Enlitic正在使用深度学习来检测CT图像中的肺癌结节,其算法比一个胸科医生组成的专家团队的准确率高50%。
在人工智能的帮助下,其他医疗保健公司正在经历诊断、治疗甚至治愈的过程。Insilico Medicine正在用深度学习算法寻找新药和治疗方法,包括新的免疫疗法。这些基因疗法使用每个病人的细胞来模拟他们自己的生物学和免疫系统。
人工智能之所以能使这些疗法奏效,是因为它能设计出组合疗法,并以闪电般的速度,以模拟的形式进行数百万次实验,来识别令人难以置信的复杂生物标记物。
纵观深度学习在人工智能不同细分领域中的应用,在计算机视觉、语音识别和自然语言处理等领域中成绩相对显著。但是在其他相关领域,依然不时涌现新的深度结构及其算法。
- 点赞
- 收藏
- 关注作者
评论(0)