建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
设置昵称

在此一键设置昵称,即可参与社区互动!

确定
我再想想
选择版块
网络人工智能 主题:6062帖子:21546

【技术干货】

人工智能的门派和武功(二)

Serene 2018/11/29 8001

接下来,看看机器人领域。这有一家明星公司,Boston Dynamics。这两年大家基本上都被他家出的各种小视频刷屏了,踢不倒的机器狗Spotmini,还能自己学会爬楼梯,可以后空翻的机器人 Atlas,日常搬箱子没有压力等等。如果是之前没看过的朋友强烈建议上网搜一下相关的视频,或许会让你大吃一惊,下巴直接掉到桌子上。但是且慢,为什么Google收购这家公司才2年之后就决定出售给软银呢? 用Google的说法是看不到短期商用的可能性。电池续航能力和噪音可能是两个主要原因。比如说机器狗Spotmini,一次充电仅能运行90分钟。 机器狗的噪音也非常大,不知道各位有没有注意到视频中当机器狗跑近的时候,轰隆隆的马达声音。或许这就是为什么至今Boston Dynamics的机器人都主要靠Youtube小视频刷存在感的原因。最新消息是Spotmini机器狗有希望2019年商用。

962e225491ab2d721174_310x230.jpg

( 人形四足机器人 Atlas )


      继续看看博弈领域。这两年风头大盛的AlphaGo,相信大家都比较清楚。这里就简单介绍一下其演进历史(内容摘自中科大大牛si-yuanzhang的blog)。

1、AlphaGo-Fan是第一个版本,击败欧洲围棋冠军樊

麾,运行的时候需要几百个GPU,棋力相当于人类职业5段。

2、AlphaGo-Lee, 也就是2016年4:1击败李世石的版本,采用了48个TPU, 因为击败了李世石,棋力可算是9.5段。

3、Alphago-Master, 在野狐在线围棋平台上连胜60场的版本,也是在乌镇上3:0击败柯洁的版本,仅需要4个TPU和2个CPU。

4、AlphaGo-Zero, 不使用任何人类对战的棋谱,不使用除了对战规则之外的任何围棋知识(如定式、劫争,甚至连征子这种基本技巧都算)。仅用三天训练就能以100:0击败AlphaGo-Lee。硬件配置同Master。

5、AlphaZero, 这个就厉害了,名字中去掉了Go(围棋),也就是同一套软件可以学习国际象棋、日本将棋等,并击败了当今最强的国际象棋软件Stockfish(当今人类顶级棋手根本无法与之对弈 )。

     看完这个进化史,大家是否觉得很恐怖?机器进化这么快,还让我们人类怎么混啊!

27f1725491acaf139048_458x251.jpg

( 2016年的惊天新闻,AlphaGo 4:1战胜李世石)


      且慢慌张,我们之前提到过,本质上围棋就是一个(19*19)^(19*19)的搜索树,只是因为这个数字过于庞大,所以需要使用算法(基于人类的围棋知识)来简化搜素路径。 围棋、国际象棋、中国象棋这些游戏我们称之为“有限状态完全信息零和博弈游戏”, 都可以通过一颗搜索树来求解的游戏。对于这一类游戏,可以说人工智能已经找到了方法,完胜人类。 但是很多游戏比如说 星际争霸2、Dota2 可不是这一类游戏, 在星际争霸游戏里电脑可没有完全信息, 因为有战争迷雾,电脑不知道对手在干啥,信息不全就很难对当前形式做出正确的判断,相当于强化学习中的价值函数评估不准。游戏也并非有限状态,就是说每盘游戏每个时刻的情形都不会是重复的,不像棋类即便是(19*19)^(19*19)这样的天文数字也还是个有限状态。

      对于这类“非完全信息、非有限状态”游戏,人工智能就还有很长的路要走。 2016年11月份,Deepmind就宣布和暴雪合作,尝试用AI玩星际争霸2。现在看来Deepmind的尝试困难重重,因为看不到短期内突破的希望,不得不于2017年8月份公开API开发接口,号召全球技术人员一起来努力。而之前他家在围棋上看到突破的希望后,就赶紧加强保密,然后精心安排和李世石对弈,直接搞出一个全球轰动的大新闻。 具体技术瓶颈点较多, 最主要的一个是游戏任务目标过于复杂,玩过星际争霸1的同学都知道,游戏中有多个小目标包括 采矿、造兵、侦查、骚扰、打赢局部战役、正面大规模作战等等,在这些小目标之间经常需要互相妥协,有的时候放弃局部战争去骚扰可能能取得更好的效果, 这样某个状态下采取的行动和反馈(Action-Reward)关联性就不明确,比如说虫族开局6条小狗rush肯定要损失金钱,但是如果rush成功收益又很大,Reward是在Action的时间很久之后,Reward函数该如何去设计呢? 这些都是在围棋上都没碰到的问题。

       最后看看逻辑推理领域。IBM的Watson系统前几年也刷了一波存在感。 特别是2011年在电视节目Jeopardy!上战胜了人类顶尖对手。对于答题类游戏,大家或许都有困惑,市面上各种chat bots聊天机器人大家都多少见识过了,比如微软小冰,经常聊天牛头不对马嘴,前头也介绍过这是NLP自然语言处理领域的瓶颈,机器对语义的理解不行。 所以我们看看这个比赛题目到底怎么样。

795f325491b25b26829e_500x336.jpg

( IBM WATSON在Jeopardy!

和历史成绩最好的两位人类高手比赛 )


      题目1: “Its largest airport is named for a World War II hero; its second largest, for a World War II battle.” 中文:该城市最大机场以一位二战英雄命名,第二大机场以二战的一场战役命名。 显然这个题目是比较难的,首先电脑要理解题目,其次要知道二战的历史,还把城市和机场等概念放在一起考虑。 IBM Watson答题为 多伦多,而正确答案是芝加哥。

      题目2:“It was the anatomical oddity of US gymnast George Eyser who won a gold medal on the parallel bars in 1904” 中文: 美国体操运动员George Eyser在1904年赢得了一枚双杠金牌,这真是生理解剖学的奇迹。这道题很难,因为George Eyser只有一条腿,所以说夺得双杠金牌是个奇迹。 但对于电脑而言,要从这这句话的字面理解什么是意思,为什么说是奇迹? IBM Watson给出的答案是Leg腿,而正确答案是 Missed a Leg缺一条腿。 

      有兴趣的同学可以上优酷上搜索相关的视频看看,自行感受一下。在视频中IBM Watson和2个人类选手一起比赛,可以听懂电视节目主持人的语音提问并用语音选题和用语音答题,也能看懂电视屏幕上的文字题目内容。 显然这里Watson使用了大量最新的NLP技术,包括理解文字和语音, 以及把题目答案变成语音输出。这些是前台人机交互部分,背后的系统关键技术还是一套专家系统,包括知识库、搜索、计算和逻辑推理。 当然专家系统、知识工程这种老掉牙的名字IBM是不会用的啦,IBM把这个系统叫做DeepQA,并用了一个新名词Cognitive computing认知计算,所谓认知计算就是能够理解非结构化数据。DeepQA系统存储了大量的图书、新闻、电视、电影、剧本、词典、文轩和百科全书,全部资料长达2亿页。这些信息,对于计算机而言就是非结构化数据,需要通过信息抽取等手段去变成计算机可以理解的结构化数据(存在数据库表中,提取后即可用于逻辑运算的)。

287e425491b2bc60ae44_404x281.jpg

(典型专家系统的结构)


      在2011年初取得Jeopardy!电视节目胜利的新闻效应之后,IBM把Watson视为其翻身的关键,并规划了4个商业化道路,分别是医疗、金融、呼叫中心和政府公共事业。 整整7年过去了(28个季度),现在IBM市场表现如何?连续23个季度的营收下滑。2016年有分析师抱怨,IBM Watson看起来仍然是个营销工具而不是一个盈利工具。 果然在2017年Watson在部署在了全球肿瘤领域最著名的医疗机构MD Anderson之后,被惨遭解约。原因据说有两个,其一是IBM Watson对数据获取和数据格式的要求过于苛刻,部署复杂,成本急剧上升。其二,MD Anderson不但要出医院的数据资源,还要出医学目标,还要出医疗场景,还要付给IBM 近4千万美金。。。当然,IBM自己坚称不是Watson系统的技术问题。

       好了,几个人工智能典型应用领域的故事基本讲完了。 让我们简单总结一下这几个应用领域的当前状态。

1、计算机视觉, 的确在有标注的给定测试集上的检测、识别、分类任务上, AI有了长足的进步。但测试成绩跟测试数据集、任务、环境关系非常大,分数不能说明一切。无标注图像中信息的提取是下一步难点。

2、计算机自然语言处理,近年有了神经元网络模型的加持后,机器翻译水平突飞猛进,但最难的偏偏就是最后的几个百分点的提升。此外,能翻译准确不等于理解了语义,这个是现在基于统计方法的致命伤。所以大家都在提认知工程Cognitive engineering, 认知就是要能理解。神经元网络就是个傻子,算的很准,但完全不理解为啥,不能抽取知识。

3、自动驾驶, Waymo基本上让大家看到曙光了。虽然距离普遍大规模商用还有一段距离,主要是恶劣天气、复杂路况、各种紧急异常情况下的处理测试还不太够。

4、博弈游戏, Deepmind彻底搞定了有限状态、完全信息博弈游戏。但对于非有限状态的、多人、非完全信息、复杂多子目标的电脑游戏如星际争霸2,就困难重重。

5、机器人,别看Boston Dynamics很炫,现在也只是个网红。距离现实世界大规模商用恐怕还有一段时日,希望19年能看到Spotmini率先商用发布。 当然机器人领域实在是复杂,能取得当前这样的成绩已经很不容易了。

6、IBM Watson专家系统,最关键的是认知工程能力跟不上,在医院应用,但又需要院方录入各种专家知识,又对数据格式要求苛刻。很难玩。


第一回合内容:人工智能的门派和武功(一)


更多内容,请听下回解读


回复0

没有评论
上划加载中
直达楼层
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

采纳成功

您已采纳当前回复为最佳回复

Serene

发帖: 13粉丝: 0

级别 : 版主

发消息 + 关注

发表于2018年11月29日 19:21:53 8001 0
直达本楼层的链接
楼主
显示全部楼层
[技术干货] 人工智能的门派和武功(二)

接下来,看看机器人领域。这有一家明星公司,Boston Dynamics。这两年大家基本上都被他家出的各种小视频刷屏了,踢不倒的机器狗Spotmini,还能自己学会爬楼梯,可以后空翻的机器人 Atlas,日常搬箱子没有压力等等。如果是之前没看过的朋友强烈建议上网搜一下相关的视频,或许会让你大吃一惊,下巴直接掉到桌子上。但是且慢,为什么Google收购这家公司才2年之后就决定出售给软银呢? 用Google的说法是看不到短期商用的可能性。电池续航能力和噪音可能是两个主要原因。比如说机器狗Spotmini,一次充电仅能运行90分钟。 机器狗的噪音也非常大,不知道各位有没有注意到视频中当机器狗跑近的时候,轰隆隆的马达声音。或许这就是为什么至今Boston Dynamics的机器人都主要靠Youtube小视频刷存在感的原因。最新消息是Spotmini机器狗有希望2019年商用。

962e225491ab2d721174_310x230.jpg

( 人形四足机器人 Atlas )


      继续看看博弈领域。这两年风头大盛的AlphaGo,相信大家都比较清楚。这里就简单介绍一下其演进历史(内容摘自中科大大牛si-yuanzhang的blog)。

1、AlphaGo-Fan是第一个版本,击败欧洲围棋冠军樊

麾,运行的时候需要几百个GPU,棋力相当于人类职业5段。

2、AlphaGo-Lee, 也就是2016年4:1击败李世石的版本,采用了48个TPU, 因为击败了李世石,棋力可算是9.5段。

3、Alphago-Master, 在野狐在线围棋平台上连胜60场的版本,也是在乌镇上3:0击败柯洁的版本,仅需要4个TPU和2个CPU。

4、AlphaGo-Zero, 不使用任何人类对战的棋谱,不使用除了对战规则之外的任何围棋知识(如定式、劫争,甚至连征子这种基本技巧都算)。仅用三天训练就能以100:0击败AlphaGo-Lee。硬件配置同Master。

5、AlphaZero, 这个就厉害了,名字中去掉了Go(围棋),也就是同一套软件可以学习国际象棋、日本将棋等,并击败了当今最强的国际象棋软件Stockfish(当今人类顶级棋手根本无法与之对弈 )。

     看完这个进化史,大家是否觉得很恐怖?机器进化这么快,还让我们人类怎么混啊!

27f1725491acaf139048_458x251.jpg

( 2016年的惊天新闻,AlphaGo 4:1战胜李世石)


      且慢慌张,我们之前提到过,本质上围棋就是一个(19*19)^(19*19)的搜索树,只是因为这个数字过于庞大,所以需要使用算法(基于人类的围棋知识)来简化搜素路径。 围棋、国际象棋、中国象棋这些游戏我们称之为“有限状态完全信息零和博弈游戏”, 都可以通过一颗搜索树来求解的游戏。对于这一类游戏,可以说人工智能已经找到了方法,完胜人类。 但是很多游戏比如说 星际争霸2、Dota2 可不是这一类游戏, 在星际争霸游戏里电脑可没有完全信息, 因为有战争迷雾,电脑不知道对手在干啥,信息不全就很难对当前形式做出正确的判断,相当于强化学习中的价值函数评估不准。游戏也并非有限状态,就是说每盘游戏每个时刻的情形都不会是重复的,不像棋类即便是(19*19)^(19*19)这样的天文数字也还是个有限状态。

      对于这类“非完全信息、非有限状态”游戏,人工智能就还有很长的路要走。 2016年11月份,Deepmind就宣布和暴雪合作,尝试用AI玩星际争霸2。现在看来Deepmind的尝试困难重重,因为看不到短期内突破的希望,不得不于2017年8月份公开API开发接口,号召全球技术人员一起来努力。而之前他家在围棋上看到突破的希望后,就赶紧加强保密,然后精心安排和李世石对弈,直接搞出一个全球轰动的大新闻。 具体技术瓶颈点较多, 最主要的一个是游戏任务目标过于复杂,玩过星际争霸1的同学都知道,游戏中有多个小目标包括 采矿、造兵、侦查、骚扰、打赢局部战役、正面大规模作战等等,在这些小目标之间经常需要互相妥协,有的时候放弃局部战争去骚扰可能能取得更好的效果, 这样某个状态下采取的行动和反馈(Action-Reward)关联性就不明确,比如说虫族开局6条小狗rush肯定要损失金钱,但是如果rush成功收益又很大,Reward是在Action的时间很久之后,Reward函数该如何去设计呢? 这些都是在围棋上都没碰到的问题。

       最后看看逻辑推理领域。IBM的Watson系统前几年也刷了一波存在感。 特别是2011年在电视节目Jeopardy!上战胜了人类顶尖对手。对于答题类游戏,大家或许都有困惑,市面上各种chat bots聊天机器人大家都多少见识过了,比如微软小冰,经常聊天牛头不对马嘴,前头也介绍过这是NLP自然语言处理领域的瓶颈,机器对语义的理解不行。 所以我们看看这个比赛题目到底怎么样。

795f325491b25b26829e_500x336.jpg

( IBM WATSON在Jeopardy!

和历史成绩最好的两位人类高手比赛 )


      题目1: “Its largest airport is named for a World War II hero; its second largest, for a World War II battle.” 中文:该城市最大机场以一位二战英雄命名,第二大机场以二战的一场战役命名。 显然这个题目是比较难的,首先电脑要理解题目,其次要知道二战的历史,还把城市和机场等概念放在一起考虑。 IBM Watson答题为 多伦多,而正确答案是芝加哥。

      题目2:“It was the anatomical oddity of US gymnast George Eyser who won a gold medal on the parallel bars in 1904” 中文: 美国体操运动员George Eyser在1904年赢得了一枚双杠金牌,这真是生理解剖学的奇迹。这道题很难,因为George Eyser只有一条腿,所以说夺得双杠金牌是个奇迹。 但对于电脑而言,要从这这句话的字面理解什么是意思,为什么说是奇迹? IBM Watson给出的答案是Leg腿,而正确答案是 Missed a Leg缺一条腿。 

      有兴趣的同学可以上优酷上搜索相关的视频看看,自行感受一下。在视频中IBM Watson和2个人类选手一起比赛,可以听懂电视节目主持人的语音提问并用语音选题和用语音答题,也能看懂电视屏幕上的文字题目内容。 显然这里Watson使用了大量最新的NLP技术,包括理解文字和语音, 以及把题目答案变成语音输出。这些是前台人机交互部分,背后的系统关键技术还是一套专家系统,包括知识库、搜索、计算和逻辑推理。 当然专家系统、知识工程这种老掉牙的名字IBM是不会用的啦,IBM把这个系统叫做DeepQA,并用了一个新名词Cognitive computing认知计算,所谓认知计算就是能够理解非结构化数据。DeepQA系统存储了大量的图书、新闻、电视、电影、剧本、词典、文轩和百科全书,全部资料长达2亿页。这些信息,对于计算机而言就是非结构化数据,需要通过信息抽取等手段去变成计算机可以理解的结构化数据(存在数据库表中,提取后即可用于逻辑运算的)。

287e425491b2bc60ae44_404x281.jpg

(典型专家系统的结构)


      在2011年初取得Jeopardy!电视节目胜利的新闻效应之后,IBM把Watson视为其翻身的关键,并规划了4个商业化道路,分别是医疗、金融、呼叫中心和政府公共事业。 整整7年过去了(28个季度),现在IBM市场表现如何?连续23个季度的营收下滑。2016年有分析师抱怨,IBM Watson看起来仍然是个营销工具而不是一个盈利工具。 果然在2017年Watson在部署在了全球肿瘤领域最著名的医疗机构MD Anderson之后,被惨遭解约。原因据说有两个,其一是IBM Watson对数据获取和数据格式的要求过于苛刻,部署复杂,成本急剧上升。其二,MD Anderson不但要出医院的数据资源,还要出医学目标,还要出医疗场景,还要付给IBM 近4千万美金。。。当然,IBM自己坚称不是Watson系统的技术问题。

       好了,几个人工智能典型应用领域的故事基本讲完了。 让我们简单总结一下这几个应用领域的当前状态。

1、计算机视觉, 的确在有标注的给定测试集上的检测、识别、分类任务上, AI有了长足的进步。但测试成绩跟测试数据集、任务、环境关系非常大,分数不能说明一切。无标注图像中信息的提取是下一步难点。

2、计算机自然语言处理,近年有了神经元网络模型的加持后,机器翻译水平突飞猛进,但最难的偏偏就是最后的几个百分点的提升。此外,能翻译准确不等于理解了语义,这个是现在基于统计方法的致命伤。所以大家都在提认知工程Cognitive engineering, 认知就是要能理解。神经元网络就是个傻子,算的很准,但完全不理解为啥,不能抽取知识。

3、自动驾驶, Waymo基本上让大家看到曙光了。虽然距离普遍大规模商用还有一段距离,主要是恶劣天气、复杂路况、各种紧急异常情况下的处理测试还不太够。

4、博弈游戏, Deepmind彻底搞定了有限状态、完全信息博弈游戏。但对于非有限状态的、多人、非完全信息、复杂多子目标的电脑游戏如星际争霸2,就困难重重。

5、机器人,别看Boston Dynamics很炫,现在也只是个网红。距离现实世界大规模商用恐怕还有一段时日,希望19年能看到Spotmini率先商用发布。 当然机器人领域实在是复杂,能取得当前这样的成绩已经很不容易了。

6、IBM Watson专家系统,最关键的是认知工程能力跟不上,在医院应用,但又需要院方录入各种专家知识,又对数据格式要求苛刻。很难玩。


第一回合内容:人工智能的门派和武功(一)


更多内容,请听下回解读


举报
分享

分享文章到朋友圈

分享文章到微博

游客

您需要登录后才可以回帖 登录 | 立即注册

结贴

您对问题的回复是否满意?
满意度
非常满意 满意 一般 不满意
我要反馈
0/200