华为云数字人赋能千行百业,共享AIGC新机遇

举报
媒体服务小助手ultra 发表于 2023/10/27 10:27:27 2023/10/27
【摘要】 数字人被称为元宇宙中真人沉浸式体验的重要入口,伴随元宇宙和AIGC双轮产业进步,数字人+究竟有什么样的新玩法?数字人将会带来什么样的产业变革?带你解密AIGC基础设施,盘古数字人大模型,如何制作数字人及数字人的直播场景。

AIGC媒体基础设施,重塑智能化数字内容生产新模式

AIGC媒体基础设施是基于华为云的基础设施构建的,包括海量的算力、全球一张网等等,在上面构建MetaEngine媒体服务引擎,这个引擎包括了图形引擎和盘古数字人大模型,图形引擎通过建模、仿真、渲染等能力来实现从“拍摄”走向“计算”。盘古数字人大模型是基于数字人大模型、视频大模型、3D大模型来实现由“模型”生成“像素”。基于MetaEngine媒体引擎,在上面构建一个服务:MetaStudio 数字内容生产线。MetaStudio 数字内容生产线包括两部分,第一部分Studio是面向工作室,我们提供了一站式的云制作,协同桌面,云渲染的核心能力。另一部分是今天重点要阐述的AIGC AIGC基础设施里我们提供了三大块能力:AIGC 视频、数字空间、数字人。这三大板块,重点介绍数字人板块。

盘古数字人大模型,赋能千行百业数字化营销新模式

AIGC生产的数字人怎么让你分辨不出来?最底层是基于数字人大模型,这个大模型基于两类能力。第一类是基于模型生成能力,包括数字人的形象数据、动作数据、表情数据、声音数据等等,基于这些数据我们会提供一个模型生成的服务能力。第二类是基于模型驱动能力,人生成出来以后只是一个制作态,那怎么把这个人有效的驱动起来?这就依赖模型驱动的能力,包括语音、语义、情感等等方面的数据。这一系列的能力就组成了我们最底层的数字人大模型的能力。

AIGC-数字人:让人人拥有数字人分身,赋能行业由“真人实拍”走向“AI数字人”

AIGC数字人的生产流程:首先需要用户录制一个5分钟左右包括声音的视频,声音用来克隆用户的音色、说话语调等特征。通过华为云数字人通用大模型和个性化大模型,就可以进行形象和声音的复刻,生成这个用户的分身数字人。华为云生成的数字人口型准确率高达95%以上。在各行各业里,都可以使用通过AIGC方式生产出的数字人进行视频类播报、直播类的应用、交互类的应用等。

数字人直播:大模型、数字人为直播注入新活力,带来更多商机

数字人的一大应用场景是分身数字人辅助真人去做电商直播或者企业直播或者等。在一些真人不适合的时间,比如说在晚上12点到早上7点,去做直播,可以增加直播时长,有效的提升品牌曝光率等,同时也会大幅的降低人工成本,给企业带来更多的销售机会。数字人直播最底层是基于华为云提供三大能力:

1.数字人训练服务:声音制作和形象制作

2.数字人推理服务:实时驱动数字人讲话、动作等,接入盘古大模型进行智能问答、话术生成等服务

3.直播服务:可以推到了各大平台上,包括我们国内主流的这几个平台。

数字人直播高级配置

为了使我们的直播间更加生动真实,我们增加了以下措施:

  • 话术随机播放
  • 主持人轮换
  • 真人语音接管
  • 弹幕互动及自动回复
  • 开播前风险检测及告警
  • 软改摄像头及麦克风输出

 

对于弹幕信息,打赏等情况,华为云数字人直播也做了以下智能互动

  • 通过弹幕工具获取直播间事件(弹幕事件,用户入场,点赞,送礼等)
  • 对事件设置触发规则(关键词,事件,事件次数等)
  • 触发后生成回复话术(预设回答列表已支持,问答库集成客户自己预设的系统)

    数字人在各行业应用越来越广,不仅可以快速赋能直播,通过AI实现助农,把每个优秀的农产品,每个非遗传承介绍给客户;还可以用AI-数字人制作营销视频、培训视频,让企业营销成本得到更大优化;AIGC-数字人不仅是为了娱乐,而是让企业用上AI,让AI变得不是那么遥不可及。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。