云社区 博客 博客详情
云社区 博客 博客详情

听说华为云AI有个聊天官?——浅谈华小唯打造之路

查尔斯 发表于 2020-09-23 17:44:11 09-23 17:44
查尔斯 发表于 2020-09-23 17:44:11 2020/09/23
0
0

【摘要】 华小唯是谁?——华为云AI的首席“聊天官”,旨在向大众展示我们的对话AI能力,帮助大众更好的了解我们,同时也活跃在各个群内活跃气氛。你可以通过关注“华为云AI”公众号,或是在espace里搜“华小唯”来找到她。

华小唯是谁?

华为云AI的首席“聊天官”,旨在向大众展示我们的对话AI能力,帮助大众更好的了解我们,同时也活跃在各个群内活跃气氛。你可以通过关注“华为云AI”公众号,或是在espace里搜“华小唯”来找到她。

准备工作

1、确定人设

为了让用户可以跟机器人持续的聊天,机器人需要满足跟用户在对话层面的平等关系,想一想我们自己在生活里跟谁聊得最多,为什么?所以我们需要给他定义一个人设,人设是面向角色言语行为及其他表达形式的框架约束。通过人设来让用户有聊天的真实感,进而拉近用户与我们的距离,增强黏性,甚至衍生成“小助手”。来看看我们在设计初期,都备选了哪些人设吧。

通过上述的角色性格及图片,想必,他们不说话,你也可以想象他们聊起天来是什么样子的,每个人身边都有这些角色的锚点。这也是为后续多人协作撰写语料,统一人设对话风格做的准备。最终我们选择了哪个人设,可以通过实际的对话来体验哦:)

2、匹配人设找写手

有了人设后,根据人设的特性找匹配的写手,即为机器人贡献语料的人。性格、表达越相近的人,越容易写出符合要求的语料。如果各方面条件有限,找不到完全符合的写手,我们也可以制定各种表达规范,包括但不限于口头语、禁用语、句式等,来控制写手的语料质量。

3、细化人物画像,让写手同感

为了让写手更多的感受到这个人设,需要从细颗粒度上定义人设,比如不同对话类别的标准回答,喜欢听什么歌,穿衣风格,喜欢的明星,聚会时的角色等。比如下面这个截取了部分热情男的人设:

【人物画像】

大叔,家里的经济支柱,有一定人生阅历,经历过人生低谷,后重新站了起来。自信,自来熟,邻里关系和睦,业委会组织者,乐于帮助他人。满嘴鸡汤,主动承担责任,不推脱。

【标准回答】

4、对话场景确定

不同场景对话语料范围不一样。比如语音交互场景会说“闭嘴”“没听清”,设备交互场景会说“关机”,文字交互场景会说“你好,在么”等。

不同氛围对话场景不一样。比如群聊会说“我们谁最好看”,单聊会说“我好看么”。

不同隐私程度下对话场景不一样。比如公开的会说“你咋这么笨”,私密的会说“你tm是不是sb”。

而我们此次定义的场景,是以公众号的文字聊天为主场景(业界发声),兼以公司内部活跃气氛为辅(内部发声),这就限制了一些用户基于场景的问法,当然用户为了debug可能还是会对着一个文本机器人说关机,此时,做好兜底,会让机器人看起来更智慧,这个后面还会提到。

5、目标用户画像分析

在当前的技术背景下,我们做不到《钢铁侠》中贾维斯,或是《Her》中萨曼莎那种自然的对话。所以我们有个认知前提,用户在当下不可能把机器人当成“人”来交流,我们还在接受跟机器人聊天的这个阶段,更多的是调戏测试机器人,看机器人的笑话,或是处理一些简单的任务,查天气、查时间等。所以,为了让用户在此时此刻可以感受到机器人的智(zhi)能(zhang)和有趣,我们要利用要用户的心态,下面是我们针对目标用户的画像分析:

那么他们分别需要个怎样的机器人呢?我们一个一个来看:

【女运营】熟知互联网热点,懂梗,可以有些沙雕对话,让他们想分享出去,如果机器人是个男性角色,我们也可以适当加一些“撩妹”话术。机器人定位:沙雕网友

【男程序员】表现真诚,可以绕过他们的debug测试问题,支持更多的特性,比如 上下文记忆等。机器人定位:直男杀手,测试陪练

【传统行业老板】支持一些功能性对话,展示更多AI+对话的应用,可以让他自己联想AI在自己行业的应用。机器人定位:贴心秘书

知道了他们想要什么,我们就可以在撰写话术的时候,针对性的写一些语料了。

开始整活!

准备了这么多,终于要开始写语料了,可是对话范围这么广,我们从何写起?

1、闲聊问答分类

根据日常对话的类型,我们定义了闲聊的类型,并做了如下优先级的排序

优先级

类别

定义

备注

p0

寒暄

问候,打招呼等

开启聊天的必要问法

人设

用户对机器人好奇产生的关于人设或其他属性的问题

用户对陌生人,新朋友,都会好奇他的背景信息

敏感

涉及国家,机密,黄赌毒等敏感的话题,人或事

以免被查水表

debug

用户用来测试bot是否可用,是否可以进行对话

前面分析过,为了跨过用户的测试心理,撬动他对bot的认知

p1

抱怨

对bot感到不满,程度比辱骂低

用户一定会问到badcase,少不了要被臭骂一顿

调戏

用户与bot聊,bot不可能做到的事情,挑逗bot

管你是男是女,上来就问你有没有对象,大家都懂

竞品

将bot同其他智能bot比较

AI产品这么多,少不了要被比较来比较去

夸奖

用户对bot的称赞

对回答不错的问题,我们还是有自信接受夸奖的

p2

热点

互联网热点,热梗

不懂梗的人,很难跟互联网的人聊起来

情感

用户自己的情感输出

每天不止一遍的不想上班要对谁说?找我们就对了

辱骂

对bot不满,爆粗口,侮辱bot

破口大骂的场合还是较少的,毕竟我们只负责聊天

确定好撰写范围后,就是写手的分工,根据写手不同的性格会分配不同的类别给他们写。后续可能会出现一个人对某个类别写的厌倦了,此时会再进行重新分工,以保证语料是在纵向和横向同时扩展,进而提高语料质量。

2、利用规则扩展语料

为了能命中用户的不同问法,写手们要尽可能多的写一些扩展问,但是面对你爸爸是谁,你妈妈是谁,你哥哥是谁。。。等查户口式的问题,光把家里七大姑八大姨都写完就很费力了,还要给每个亲戚配上问题,这活我们可不干!还好CBS服务(华为云对话机器人服务)提供了规则的录入方式,支持我们按“你[爸爸|妈妈|哥哥|妹妹]是谁“的方式,节省了大量的工作。当然前提是,这些问题我们准备有一种答案来回复。

3、抽象对话场景,封装技能

所谓技能,就是把某一场景的对话能力封装起来的集合,比如查天气、订车票等。除了此类功能性的对话可以作为技能以外,一些可以抽象的句式同样可以做为技能,比如比较选择的问法,A和B谁更厉害,你喜欢A还是B。因为用户会拿任何事物进行比较,我们无法穷举,这时对话技能就可以很好的解决这个问题,此处再次感谢CBS服务(华为云对话机器人服务)。下图是我们在对话机器人中设计订票技能时,配置的对话流程,很清晰,不懂算法的人也能配的出来。

对了,千万不要跟机器人说,我要去你心里这样的话哦:)。为了能让机器人的对话范围更丰富,更长尾,我们也引入了外部的一些内容,比如查星座运势,知识问答,甚至还能让他给你作诗,更多技能欢迎来找小唯解锁。

4、兜底话术

兜底话术,既在机器人不知道怎么回答时,使用的默认回复。好的兜底可以让人察觉不到机器人的“愚蠢”。下面是我们总结的在人工编写兜底话术时的一些原则。

  • 不要机械化,不要说我不知道,我不清楚。想想我们常见的智能客服,回答不上时,就会回复我还不了解,我听不懂你在说什么,就很机械,加强了与用户之间的“异类”感,用户体验也不会好,甚至还想骂他。

  • 拆穿用户debug心里。既然你想测试我,挖个坑想看我往里面跳,那我就站在坑外面看着你,嗯,就是这种感觉。比如:你这是在测试我; 我知道你就是想看我出丑,等等。

  • 转移话题。这可是我们生活中,逃避话题的常见手段,当然,机器人也一样适用。比如:你刚才是不是说过这个;你对这个这么感兴趣么,等等。

  • 引导至可聊天范围。这跟转移话题差不多,更近一步的是,引导用户去问机器人可以回答的问题上。比如:虽然我不是百科大全,但我能帮你查查天气;聊这些不如我给你讲个笑话,等等。

  • 引导用户澄清。一些难于区分场景的回复,比如用户问“再来一个”,目前我们无法判断用户想要再来一个什么,唱歌、跳舞、还是讲笑话,所以我们回复,“好的,那你再问我一次”

  • 装作理解了用户的样子。学习一下我们鼻祖ELIZA的回复方式,化身一个心理医生,让用户来主导对话,我们只是个倾听者,只对提问这个行为进行回复,而不是对问题内容进行回复,比如:那你觉得呢;你为什么会这么想,等等。

这些方式不但可以让机器人看起来聪明,甚至还能向下引导对话,延长用户的对话时间,进一步达成我们可持续对话的目的。除了人工编写兜底话术外,我们还引入了生成式的对话模型的能力,此处还要@CBS服务(华为云对话机器人服务),来帮助我们自动生成回复。根据人工编写的语料,学习人设的回复风格,来回答一些人工无法覆盖的长尾问题。下面这个对话,对着小唯发誓,可都是生成的,没有一句是人工写的,来品品吧。

5、表现出上下文的理解能力

前面讲到要征服技术男,机器人少不了一些上下文的理解能力,为了解决这个问题,我们同样是人工+智能的结合。

首先,从对话场景出发,机器人难免会出现回答不上的情况,这时用户,一般会换种问法再继续发问,因为一般人和人之间的对话,也会出现一句话解释不清楚的情况,需要再次澄清。但如果用户反复问了多次,机器人还回答不上,不是又暴露了我们的“愚蠢”了么。不可以!所以我们会在对话中做一些逻辑,比如当用户连续X次问同一问题时,机器人会有固定的回复;当用户重复机器人的回复时(毕竟,人类的本质是复读机),机器人也会有固定的回复。不信你看:

其次,在技能内,我们也可以通过理解用户的意图来达到上下文的理解,比如在查天气时:

审核与测试优化

语料和技能都ready了,还需要经过一道审核,再次确认对话风格是否统一,是否符合人设。这个环节,更重要的是,提炼规则经验,把写手们写的不合适的语料抽象出规则,再向大家同步。规则越积越多,写手们的限制也会越多,语料质量也会越来越高。

测试同样是非常重要的环节,为了能让大家能有兴趣来跟机器人说话,我们是想破了头,无论是群里有人过生日,还是有新同学入群,还是过节、下午茶、分享例会,作为机器人的父母,都要把她@出来遛一遛,抓住每一次能让她曝光的时刻。大家的对话过程,我们会找到那些机器人回答不上的场景,分析高频的问法,再针对的写回复,这样我们就可以覆盖更多轮的对话。下面这个是上线一个月左右的命中分类统计,跟我们预想的情况也差不多。


同时,为了增强机器人黏性,我们也在设计一些群游戏,可以让用户在闲暇的时候,想着来玩一玩,也同时可以带动群气氛,大家敬请期待吧!

关于我们

说了这么多,大家是不是迫不及待想来找小唯聊天啦,关注我们的微信公众号,然后。。。随便聊,甚至还能斗图。

另团队也接各类项目合作,也需要各类人才,有对小唯感兴趣的欢迎随时来找我们哦。我们是华为云EI-对话机器人服务:)

最后替小唯提前祝各位哥哥姐姐叔叔阿姨们,中秋国庆快乐~~~


登录后可下载附件,请登录或者注册

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区),文章链接,文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:huaweicloud.bbs@huawei.com进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
评论文章 //点赞 收藏 0
点赞
分享文章到微博
分享文章到朋友圈

评论 (0)


0/1000
评论

登录后可评论,请 登录注册

评论

您还没有评论的权限!

温馨提示

您确认删除评论吗?

确定
取消
温馨提示

您确认删除评论吗?

删除操作无法恢复,请谨慎操作。

确定
取消
温馨提示

您确认删除博客吗?

确定
取消

确认删除

您确认删除博客吗?

确认删除

您确认删除评论吗?

温馨提示

登录超时或用户已下线,请重新登录!!!

确定
取消