【云驻共创】数字人在现今各行各业的应用情况如何?
前段时间看到一则新闻“网易天使轮千万元人民币领投虚拟人公司北京世悦星承科技有限公司”,在看到这个新闻之后,我觉得虚拟人是个不错的题材,虽然也在各种渠道见识过数字人,但是没有仔细的思考过,我问了自己下面几个问题。
到底什么数字人?
数字人在现今的各行各业的应用情况如何?
数字人涉及的技术都有哪些?
数字人的未来如何?
1、什么是数字人?
数字人这名字听着稀奇又别扭,其实它最初的原型大家都听过——NPC。玩过游戏的应该都知道,也就是游戏内玩家操纵的游戏角色,可以和玩家进行交互的角色。
广义上讲可以说是计算机模拟出的具有人的形态的虚拟人都叫做数字人,
在平常的观感上,数字人是整合了人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术的可视化数字虚拟人。他通过对人物形象的复制模拟,人物声音的克隆及语音合成,可随时随地与真人进行准确交互性对话。
通俗的讲所谓数字人,本质上是AI的一种进化,是通过计算机图形学技术进行虚拟制作的类人形象,没有现实世界中的身体。
数字人的本体存在于计算设备中(比如电脑、手机)中,通过显示设备呈现出来,让人类能通过眼睛看见。它具备人类的外观和行为模式,数字人具有人类身体的外观形体结构,表现出来的行为模式是与人类相仿的,数字人的影像通常是呈现出某种人类的活动。
2、各行业的应用情况
数字人随着技术的发展已经逐渐在各行业中进行了应用,在生活中也可以看到,现在数字人的应用很多,比较常见的大致可见的有以下几种:
2.1 演员
剧组从前六部《速度与激情》未使用的镜头中选择符合未拍摄剧本所需的表情和动作,通过转换从而生成数字成像模型,再通过CG渲染出虚拟的保罗。在替身演员进行肢体动作的拍摄后,CG技术会对图像进行脸部替代,从而让保罗在银幕上重生。而声音部分,也采用同样的方式进行采集和重编,这算是虚拟人的在电影上的使用。
2.2 虚拟偶像
二次元的虚拟人物有很多,像初音、洛天依、弱音等等,都是很多阿宅们喜欢的角色。这些二次元角色不仅外貌好看,而且都多才多艺,唱歌、跳舞、卖萌、撒娇样样精通,这样的妹子出现在自己面前,也难怪阿宅们如此着迷。
“虚拟人”则意味着万亿、兆亿级的市场,每个人都可以拥有一张虚拟皮囊,共同打造一个元宇宙(Metaverse),“在这个虚拟宇宙里,你可以看到喜欢的艺人开演唱会,你自己能实时换装,请到虚拟健身教练,交友,找到陪伴你的虚拟人。
2021年12月10日晚8点,虚拟偶像花小楼携手音乐制作人徐梦圆在《迷你世界》游戏中举办了首场虚拟演唱会。这场音乐盛会是《迷你世界》联手QQ音乐打造数字音乐场景的首次落地成果,不仅还原了现实演唱会场景,还融入了更多的沙盒游戏元素,实现了从“听音乐”向“玩音乐”升级,给用户带来“音乐元宇宙”的初体验。
2.3 数字记者“小诤”
“小诤”的名字来自于革命战争时期的王诤将军。她是新华社和NExT Studios联合打造的数字记者,与其他作为娱乐形象出现的虚拟形象不同,小诤是专门面向航天主题和场景研发的数字记者,她也肩负着相当艰巨的任务:现场报道载人航天工程、行星探测工程等国家重大航天项目。可以说小诤就是为了航天而生,她所代表的就是中国人民数千年来对无尽的天空宇宙的向往之心。
2.4 导游
以虚拟讲解员为代表的虚拟数字人应用或为其贡献蓬勃力量,多个大景区已经上线数字人AI 导览服务,比如故宫,龙门石窟等,为游客提供个性化游览路线推荐,景点文物讲解等多种服务,不光是讲,还能问,还能声情并茂的答,非常的灵性。
2.5 其他
数字人的应用还有很多地方,比如党建馆,银行大堂等服务型问答场所都是数字人的应用场景,将人们从枯燥的工作中解脱出来。数字人的应用场景很多,不仅仅局限在以上场景。
3、数字人涉及的技术都有哪些?
作为一个技术人员,对于外在的表现不是那么关心,关心的是底层的实现逻辑,这些涉及了哪些技术,这些技术的发展状况。
数字人的实现技术从两个方面进行分析,一方面是外在的表现,一方面是内在的实现。
3.1 外在的皮技术
当前外在的实现技术主要是3D建模和动作捕捉技术,这也是当前比较完善的技术链,主要应用与影视创作、动画、VR\AR\MR、虚拟偶像等场景。上限很高。比如《阿凡达》、《魔兽世界》的CG制作。
游戏开发商Epic Games免费向公众开放这项技术,利用MetaHuman Creator「超级数字人开发工具」,普通人也可以创作逼真的数字人形象。
这些不在我的专业领域,简单介绍下,就此略过。
3.2内在的魂的技术
高级的数字人现在基本上包含虚拟形象+语音交互(TTS、ASR)+自然语言理解(NLU)+深度学习等技术的实现。
声音转换技术,可以让后台真人替换,而面对虚拟数字人的人感知不到。声音转换基于深度学习和迁移学习技术,精准将原说话人的声音转换为目标说话人,同时保留原说话人的风格特色。让声音有更多的表现形式。
NLG与NLU等算法,这一块代表着数字人的核心——智能。
NLU让AI能够理解人类的语言,NLG则让AI能够思考、输出并与人类交互。以OpenAI为例,近年来的几次预训练大模型(如GPT-3)都刷新了算法SOTA的历史纪录,甚至能够部分达到人类水平。
国际上这几年的超大预训练模型发展很迅速,从BERT到GPT1.0再到3.0,SOTA算法每年都在迭代, 人工智能技术的发展将会推动数字人的进一步智能化,多场景运用。
4、数字人的未来如何?
数字人的未来如何?这个命题的答案在上面的行业应用已经显而易见了,数字人出现在各个行业,甚至在有些地方比真人做的更出色,对于人工智能的发展的应用可能决定了数字人的发展上限,数字人的发展可能会更进一步的促进元宇宙的发展,技术是一切的根本,未来可期。
本文整理自华为云社区【内容共创系列】活动。
查看活动详情:https://bbs.huaweicloud.com/blogs/314887
- 点赞
- 收藏
- 关注作者
评论(0)