从博奕、专家系统、神经计算、进化计算等视角解读人工智能历史
自第二次世界大战起,以及计算机时代的来临,人们迎接挑战,试图让计算机可以博弈,掌握复杂的棋类游戏,在此过程中,计算机科学取得了巨大的进步,编程技术的熟练程度也日臻完美。一些计算机博弈的例子,包括国际象棋、跳棋、围棋和奥赛罗,均受益于对人工智能的深度理解及其方法的应用。
1.7.1 博弈
博弈激起了人们对人工智能的兴趣,促进了人工智能的发展。1959年,亚瑟·塞缪尔(Arthur Samuel)在跳棋博弈方面的著作是早期工作的一个亮点[41] 。他的程序基于50张策略表格,用于与不同版本的自身进行博弈。在一系列比赛中失败的程序将采用获得胜利的程序的策略。这一程序使用强跳棋进行博弈,却从未掌握如何博弈。本书将在第16章中详细讨论塞缪尔对西洋跳棋博弈程序的贡献。几个世纪以来,人们一直试图让机器进行国际象棋的博弈,人类对国际象棋机器的迷恋可能源于普遍接受的观点,即只有够聪明,才能更好地博弈。1959年,Newell、Simon和Shawn开发了第一个真正的国际象棋博弈程序,这个程序遵循香农-图灵(Shannon-Turing)模式[40,42] 。理查德· 格林布拉特(Richard Greenblatt)编写了第一个俱乐部级别的国际象棋博弈程序。
20世纪70年代,计算机国际象棋程序稳步前进,直到70年代末,程序达到了专家级别(相当于国际象棋锦标赛棋手的前1%)。1983年,肯·汤普森(Ken Thompson)的Belle是第一个正式获得大师级水平的程序。随后,来自卡内基梅隆大学的Hitech也获得了成功[44] ,同时,作为第一个特级大师级(超过2400分)的程序,这也成了一个重要的里程碑。不久之后,程序Deep Thought(也来自卡内基梅隆大学)也被开发出来了,并且成了第一个能够稳定打败国际特级大师(Grandmasters)的程序。[45] 20世纪90年代,当IBM接管这个项目时,Deep Thought进化成了深蓝(Deep Blue)。在1996年的费城,世界冠军加里·卡斯帕罗夫(Garry Kasparov)“拯救了人类”,在6场比赛中,他以4:2打败了深蓝。然而,1997年,在对抗Deep Blue的后继者Deeper Blue的比赛中,卡斯帕罗夫以3.5:2.5败给了Deeper Blue,国际象棋界为之震动。在随后的6场比赛中,在对抗卡斯帕罗夫、克拉姆尼克(Kramnik)和其他世界冠军级别的棋手的过程中,程序表现得很出色,但这不是世界冠军比赛。虽然人们普遍同意这些程序可能依然略逊于最好的人类棋手,但是大多数人愿意承认,顶级程序与最有成就的人类棋手博弈不分伯仲(如果人们想起图灵测试),并且毫无疑问,在未来10到15年的某个时间内,程序很可能会夺走世界国际象棋的世界冠军。
1989年,埃德蒙顿阿尔伯塔大学的乔纳森·舍弗尔(Jonathan Schaeffer)[47] 开始了实现他的长期目标,利用程序Chinook征服跳棋游戏。1992年,在对战长期占据跳棋世界冠军宝座的马里恩·廷斯利(Marion Tinsley)的一场40回合的比赛中,Chinook以34局平局,4:2输了比赛。1994年,Tinsley由于健康原因主动放弃比赛,他们的比赛在6局之后就打平了。自从那时起,Schaeffer及其团队努力求解如何博弈残局(所有8枚棋子或更少棋子的残局),以及从开局就开始的博弈。
使用人工智能技术的其他博弈游戏(见第16章)包括西洋双陆棋、扑克、桥牌、奥赛罗和围棋(通常称为“人工智能的新果蝇”)。
1.7.2 专家系统
人们对某些领域的研究几乎与人工智能本身的历史一样长,专家系统就是其中之一。这是在人工智能领域可以宣称获得巨大成功的一门学科。专家系统具有许多特性,这使得它适合于人工智能研究和开发。这些特性包括了知识库与推理机的分离,系统知识超过了任何专家或所有专家的总和,知识与搜索技术的关系,推理以及不确定性。
最早也是最常提及的系统之一是使用启发法的DENDRAL。建立这个系统的目的是基于质谱图鉴定未知的化合物[48] 。DENDRAL是斯坦福大学开发的,目的是对火星土壤进行化学分析。这是最早的系统之一,表明了编码特定学科领域专家知识的可行性。
MYCIN也许称得上是最著名的专家系统,这个系统也来自斯坦福大学(1984)。MYCIN是为了方便传染性血液疾病的研究而开发的。然而,比其领域更重要的是,MYCIN为所有未来基于知识系统设计树立了一个典范。MYCIN有超过400条的规则,最终斯坦福医院让它与高级专科住院实习医生对话,对其进行培训。20世纪70年代,斯坦福大学开发了PROSPECTOR,用于矿物勘探[49] 。PROSPECTOR也是早期有价值的使用推理网络的例子。
20世纪70年代之后,其他著名的成功系统有:大约有10000条规则的XCON,它开发用于帮助配置VAX计算机上的电路板[50] ;GUIDON[51] 是一个辅导系统,它是MYCIN的一个分支;TEIRESIAS是MYCIN的一个知识获取工具[52] ;HEARSAY I和HEARSAY II是使用黑板(Blackboard)架构进行语音理解的最早的例子[53] 。道格·雷纳特(Doug Lenat)的AM(人工数学家)系统[54] 是20世纪70年代研究和开发工作另一个重要的结果。此外还有用于在不确定性条件下进行推理的Dempster-Schafer Theory,以及扎德在模糊逻辑方面的工作[32] 。
自20世纪80年代以来,人们在配置、诊断、指导、监测、规划、预后、补救和控制等领域已经开发了数千个专家系统。今天,除了独立的专家系统之外,出于控制的目的,还有许多专家系统已经被嵌入了其他软件系统,包括那些在医疗设备和汽车中的软件系统(例如,在汽车中应当进行牵引控制的时候)。
此外,许多专家系统外壳,例如Emycin[55] 、OPS[56] 、EXSYS和CLIPS 5[57] 已经成为工业标准。人们也开发出了众多知识表示语言。今天,许多专家系统在幕后工作,增强了日常的体验,如在线购物车。在第9章中,我们将讨论许多主要的专家系统,包括它们的方法、设计、目的和主要特点。
1.7.3 神经计算
1.5.6节提到了McCulloch和Pitts在神经计算发面进行的早期研究[17] 。他们试图理解动物神经系统的行为,但他们的人工神经网络(ANN)模型有一个严重的缺点,即它不包括学习机制。
弗兰克·罗森布拉特(Frank Rosenblatt)[58] 开发了一种称为感知器学习规则 (Perceptron Learning Rule)的迭代算法,以便在单层网络(网络中的所有神经元直接连接到输入)中找到适当的权重。在这个新兴学科中,由于Minsky和Papert [59] 声明某些问题不能通过单层感知器解决,如异或(XOR)函数,因此研究遭遇了重重障碍。在此声明宣布后,联邦资助的神经网络研究受到了严重削弱。
20世纪80年代初期,由于霍普菲尔德(Hopfield)的工作,这个领域见证了第二次爆发式的活动[60] 。他的异步网络模型(Hopfield网络)使用能量函数找到了NP完全问题的近似解[61] 。20世纪80年代中期,人工智能领域也见证了反向传播 (backpropagation)的发现,这是一种适合于多层网络的学习算法。人们一般采用基于反向传播的网络来预测道琼斯(Dow Jones)的平均值,以及在光学字符识别系统中读取印刷材料(有关详细信息,请参见第11章)。神经网络也用于控制系统。ALVINN是卡内基梅隆大学的项目[62,63] ,在这个项目中,反向传播网络感测高速公路协助Navlab车辆转向。这项工作的一个直接应用是,无论何时,当车辆偏离车道时,系统会提醒由于缺乏睡眠或其他条件而使判断力受到削弱的驾驶员。
1.7.4 进化计算
在1.5.7节中,我们讨论了遗传算法。人们笼统地将这些算法归类为进化计算。回想一下,遗传算法使用概率和并行性来解决组合问题,也称为优化问题。这种搜索方法是由约翰·霍兰德(John Holland)开发的[65] 。
然而,进化计算不仅仅涉及优化问题。麻省理工学院计算机科学和人工智能实验室的前主任罗德尼·布鲁克斯(Rodney Brooks)放弃了基于符号的方法,转用自己的方法成功地创造了一个人类水平的人工智能,在论文中[66] ,他巧妙地将这个人类水平的人工智能称为“人工智能研究的圣杯”。基于符号的方法依赖于启发法(见1.3节)和表示范例(见1.5.3节和1.5.4节)。在他的包容体系架构
(subsumption architectural approach)的方法中(可以将智能系统设计成为多个层次,其中较高级别的层依然依赖下面的层。例如,如果你要建立能够避免障碍的机器人,那么障碍物避免例程必须建立在较低的层次,这个较低的层次可能仅仅负责机器人的运动),他主张世界本身就应该作为我们的代表。布鲁克斯坚持认为,智能体通过与环境进行交互才出现智能。他最著名的成就可能就是在实验室里建立的类似昆虫的机器人,这体现了这种智能哲学。在此处,一群自主机器人与环境交互,也彼此交互。第12章探讨了进化计算领域。
{补充资料!}
NETtalk64是一个为了阅读英语文本,学习正确英语发音的反向传播应用程序。程序员宣称这个软件发出的英语声音具有95%的准确性。显然,由于英语单词发音中固有的不一致性,如rough(粗糙)和through(通过),以及单词的发音具有不同的外部来源,如pizza(比萨)和fizzy(泡沫),因此才出现了问题。第11章将更全面地探讨神经计算对智能系统设计的贡献。
1.7.5 自然语言处理
如果我们希望建立智能系统,就要求系统拥有方便人类理解的语言,使其看起来很自然。对于许多早期从业者而言,这是不言自明的。两个著名的早期应用程序是约瑟夫·魏赞鲍姆(Joseph Weizenbaum)的Eliza和特里·维诺格拉德(Winograd)的SHRDLU。[20]
在Linotype排字机上,英语语言中最常用的字母是ETAOIN SHRDLU。Winograd的程序是以第二组字母命名的。
约瑟夫·魏赞鲍姆是麻省理工学院的计算机科学家,他与来自斯坦福大学的精神病医师肯尼斯·科尔比(Kenneth Colby)一起工作,开发了Eliza程序[67]
。Eliza旨在模仿卡尔·罗杰斯(Carl Rogers)学派的精神病学家所起的作用。例如,如果用户键入“我感到疲劳”,Eliza可能会回答:“你说你觉得累了。请告诉我更多内容。”这种“对话”将会以这种方式继续,在对话的原创性方面,机器很少做出贡献或没有贡献。精神分析师可能会以这种方式表现,希望患者能发现他们真实的(也许隐藏的)感受和沮丧。同时,Eliza仅用模式匹配假装类似人类的交互。
当人与机器之间的界限(例如:Android)变得不太清楚时,会发生什么——也许在大约50年后——这些机器人将不那么像浊骨凡胎,更像是永生不朽者?
让人好奇的是,魏赞鲍姆的学生和普通公众对和Eliza的互动充满了兴趣,即使他们完全意识到Eliza只是一个程序,这令魏赞鲍姆感到非常不安。同时,精神病医师Colby仍然致力于该项目,并写出了一个成功的程序(称为DOCTOR)。Eliza对自然语言处理(NLP)的贡献不大,因为这种软件只是假装拥有人类能够感知情绪的能力,而这种能力这也许是人类硕果仅存的“特殊性”了。
NLP的下一个里程碑不会引起任何争议。特里·维诺格拉德(Terry Winograd)[20] 开发了SHRDLU,这是他的麻省理工学院博士论文的项目。SHRDLU使用意义、语法和演绎推理来理解和响应英语命令。它的对话世界,是在一个桌面上放着各种形状、大小和颜色的积木(在1.5.8节中介绍了维诺格拉德的积木世界)。
{人物轶事}
谢丽·特克尔(Sherry Turkle)
对许多人来说,他们认为一些人沉迷于类似Eliza的程序似乎有点令人遗憾,他们认为这是一些人对生活感到沮丧的迹象。2006年夏,在达特茅斯学院校园举行的人工智能@ 50研讨会上(“达特茅斯人工智能研讨会:下一个五十年”),与会者在彼此的闲谈中表达了他们对Eliza的这种关注。这场讨论的其中一名参与者是谢丽·特克尔,她是一名进行分析型训练的心理学家,在麻省理工学院的科学、技术和社会的项目中工作。自然,特克尔很有同情心。
特克尔[68]对她所谓的“关系型人造物”进行了大量的研究。这些设备、玩具和机器人所定义的属性不是它们的智能,而是它们能够唤起与之交互的人的关爱行为。1997年,美国的第一个关系型人造物Tamagotchis诞生,它们是液晶显示屏上的虚拟动物。为了让这些生物“成长”为健康的“成年动物”,许多孩子(及其父母)不得不不断地“喂养”“清洁”和“培养”它们。最近,研究者开发了一些MIT机器人(包括Cog、Kismet和Paro),使它们具有伪装人类情感的神奇能力,并能够唤起与之交互的人的情绪反应。特克尔研究了疗养院中儿童和老年人与这些机器人形成的关系,这些关系涉及了真正的情感和关怀。特克尔谈到,或许需要重新定义“关系”一词,使之包括人们与这些所谓的“关系型人造物”的相遇。但是,她仍然相信,这样的关系永远不会取代那种只能发生在必须每天面对死亡的人类之间的联系。
机器人手臂可以与这个桌面互动,实现各种目标。例如,如果要求SHRDLU举起一个红色积木,在这个红色的积木上有一个小绿色积木,它知道在举起红色积木之前,必须移除绿色积木。与Eliza不同,SHRDLU能够理解英语命令并做出适当的回应。
HEARSAY[69] 是一个雄心勃勃的语音识别程序(见1.7.2节),这个程序采用了黑板架构(blackboard architecture),在黑板架构中,组成语言的各种组件(如语音和短语),的独立知识源(智能体)可以自由通信,使用语法和语义裁剪除去不可能的单词组合。
HWIM(发音为“Whim”,是Hear What I Mean的缩略形式)工程[70]
使用增强的转移网络来理解口语。它有一张1000个单词的词汇表,处理旅行预算管理。也许这个工程的目标过于雄心勃勃,因此它的表现不如HEARSAY II。
在这些成功的自然语言程序中,解析发挥了不可或缺的作用。SHRDLU采用上下文无关的语法解析英语命令。上下文无关的语法提供了处理符号串的句法结构。然而,为了有效地处理自然语言,还必须考虑到语义。
{补充资料!}
解析树提供了构成句子的单词之间的关系。例如,许多句子可以分解为主语和谓语。主题可以被分解成一个名词短语,后面跟着一个介词短语,等等。基本上,解析树给出了语义,而所谓语义就是句子的意思。
前面提到的每个早期语言的处理系统,在某种程度上采用的都是世界知识。然而,20 世纪80年代后期,NLP进步的最大障碍是常识的问题。例如,虽然在NLP和人工智能的特定领域建立了许多成功的方案,但它们经常被批评只是微观世界,意思是程序没有一般的现实世界的知识或常识。
例如,虽然程序可能知道很多关于特定场景的知识,如在餐馆订购食物,但是它没有男女服务员是否还活着或者他们是否穿着通常的衣服这些知识。在过去的25年里,德克萨斯州奥斯汀MCC的道格拉斯·勒纳特(Douglas Lenat)[71] 已经建立了最大的常识知识库来解决这个问题。
最近,NLP领域出现了一个重大模式转变。在这种相对较新的方法中,统计方法控制着句子的语法分析树,而不是世界知识。
查尼阿克(Charniak)[72] 描述了如何增强上下文无关的语法,赋予每个规则相关概率。例如,这些相关概率可以从宾州树库(Penn Treebank)中获取[73] 。宾州树库包含了手动解析的超过一百万单词的英语文本,这些文本大部分来自《华尔街日报》。查尼阿克演示了这种统计方法如何成功地解析《纽约时报》首页的一个句子(即使对大多数人而言,这也并非琐碎)。
第13章将进一步描述NLP的统计方法和机器翻译最近所取得的成功。
1.7.6 生物信息学
生物信息学是新生学科,是将计算机科学的算法和技术应用于分子生物学中的学科,主要关注生物数据的管理和分析。在结构基因组学中,人们尝试为每个观察到的蛋白质指定一个结构。自动发现和数据挖掘可以帮助人们实现这种追求[74] 。胡里斯卡(Juristica)和格拉斯哥(Glasgow)演示了基于案例的推理,能够协助发现每个蛋白质的代表性结构。在2004年度关于人工智能和生物信息学的AA人工智能特刊中,Juristica、Glasgow和Rost在其所写的调查文章中指出:“在生物信息学近期活动中,发展最快的领域可能是微阵列数据的分析。”[74]
对于可获得的数据,不论在其种类还是在数量上,都对微生物学家造成了重负——这要求他们完全基于庞大的数据库来理解分子序列、结构和数据。许多研究人员认为,实践将证明来自知识表示和机器学习的人工智能技术是大有用处的。
本文摘自《人工智能》(第2版)
人工智能百科全书
易于上手的人工智能自学指南
涵盖机器学习 深度学习 自然语言处理 神经网络 计算机博弈等各种知识
图文详细 讲解细致 配备丰富的教学资源和学习素材
本书是作者结合多年教学经验、精心撰写的一本人工智能教科书,堪称“人工智能的百科全书”。全书涵盖了人工智能简史、搜索方法、知情搜索、博弈中的搜索、人工智能中的逻辑、知识表示、产生式系统、专家系统、机器学习和神经网络、遗传算法、自然语言处理、自动规划、机器人技术、高级计算机博弈、人工智能的历史和未来等主题。
本书提供了丰富的教学配套资源,适合作为高等院校人工智能相关专业的教材,也适合对人工智能相关领域感兴趣的读者阅读和参考。
● 基于人工智能的理论基础,展示全面、新颖、丰富多彩且易于理解的人工智能知识体系。 ● 加入关于机器人和机器学习的新章节,并在自然语言处理在自然语言处理部分包括了关于语音理解和隐喻的小节。 ● 给出诸多的示例、应用程序、全彩图片和人物轶事,以激发读者的学习兴趣。 ● 通过实际应用引入重 要的人工智能概念,例如机器人技术、人工智能在视频游戏中的应用、神经网络、机器学习等。 ● 包含300多幅图,详细描述了人工智能方法在实际工作中的问题,并给出了部分习题的解答。 ● 提供本书所涉及的资源、仿真和书中的图。 ● 为采用本书作为教材的教师提供丰富的教学支持资源,包括习题解答、教学PPT等。
本文转载自异步社区。
原文链接:https://www.epubit.com/articleDetails?id=N4df26546-32ad-4121-852c-6d67754275b0
- 点赞
- 收藏
- 关注作者
评论(0)