【云驻共创】全球低时延一张网的技术与业务

举报
liuzhen007 发表于 2022/05/25 22:55:15 2022/05/25
【摘要】 华为云SparkRTC基于一张专业和强大的实时音视频网络,致力于为全球提供实时音视频服务,帮助客户快速获得音视频通话、互动直播等能力。同时,华为云视频团队聚集了音视频通讯领域的顶尖人才,在视频、音频领域拥有30年的技术积累,打造出最专业的实时音视频产品和服务,并多次应用在大型多国联合会议中。华为完全自主研发,在音视频处理、网络自适应、平台兼容性方面达到了业内领先水平。目前,华为云视频产品提供了非常

一、业界趋势

当前,很多云上业务产品都在面临着三大挑战,首先是内容码率的提升,为了提升用户体验,需要提升对应的视频画面质量,之前720P的视频画面要求2M左右的网络带宽,1080P的视频画面要求4M左右的网络带宽。随着4K和VR业务场景的需要,对网络带宽和视频码率都提出了更高的要求,比如VR场景要求每秒80M的网络带宽,之前720P视频画面的带宽的40倍。其次是低时延实时互动,现在已经进入到毫秒级延时时代,实时互动数据占比预计到2025年,将从2020年的8%上升到30%,超低延时的实时互动应用场景将成为未来社会的主流。还有就是伴随而来的端侧算力上云,由于数据量的激增,数据和算力逐步向云和边缘计算转移。预计到2025年,终端模块的数据和算力将由2020年的65%下降到50%,相应的云端和边缘计算将分别上升5%和10%。


1.1 多媒体内容上云的4大关键驱动力

1. 内容质量升级,算力诉求激增

内容质量升级,算力诉求激增,传统工作站模式已经无法满足日益增加的需求。举一个例子,2009年上映的《阿凡达》的特效镜头是1600个,到了2019年上映的《阿丽塔》的特效镜头是2600个;前者的面部捕捉数是830个,后者的面部捕捉数是2500个;前者的单帧渲染时长是100小时,后者的单帧渲染时长是500小时;前者的总渲染时长是1.5亿个小时,后者的总渲染时长是4.3亿个小时;前者使用的制作服务器数量是2000台,后者使用的制作服务器数量是30000台;前者的存储大小是1PB,后者的存储大小是4PB。以上数据足以说明内容数据量激增的现实趋势。

2. 实拍到数字化的直接生成的需要

当下比较流行的虚拟数字人,比如华为云的“云笙”;虚拟拍摄也逐渐成为主流,比如《头号玩家》就是使用的虚拟拍摄;还有虚拟演唱会也非常热门,比如《堡垒之夜》。


3. 机器取代人工

机器取代人工,AI自动化成为社会发展进步的趋势。当前很多行业70%的成本投入在人工上,这样状况会导致项目周期长、成本高、效率低。比如,国内影片拍摄70%的费用用在了演员身上,而对比好莱坞只有25%。相信未来,国内影视拍摄的成本分配比例也会逐步合理化。


4. 远程协作、生产制作效率提升

远程协作、生产制作效率提升,行业分工细,工序杂,分包多,异地协作要求高,比如好莱坞特效大片制作的过程涉及到数十家公司、上千人的制作团队。包括编剧、拍摄、动捕、模型、动画、特效、剪辑、色彩、声音、合成等。如果引入超低延时的实时通讯协作模式,将大大降低沟通成本和制作成本。


1.2 SparkRTC的优势


说到华为云音视频服务,很多人可能会感到陌生。其实,华为云音视频服务最早可以追溯到上世纪八十年代,1988年华为就已经向大众提供通话服务,当时华为具备国内一流的音频引擎和一流的音视频网络技术。到了2004年,华为开始对外提供视频业务,其中,包括先进的H.265编解码、最佳的VR/AR技术、一流的直播CDN能力以及对超高清分辨率的支持等。2008年,华为推出了视频会议产品,同时申请了很多相关的技术专利,包括UDP协议、抗丢包算法,另外,还具备业内一流的3A算法保证视频会议的音频质量。2017年,华为云正式上线,搭建了海量的边缘节点和CDN节点。华为云音视频服务的目标是长期专注于音视频极致体验的持续提升,引领行业发展。


二、SparkRTC全球一张网

华为云的SparkRTC全球一张网是整个音视频实时通讯服务的基础,任何网络服务都离不开物理网络的支持,也就是UnderLay网络。比如我国的三大骨干网络,电信Chian Net、联通China169、移动CM Net,它们都分为超级核心节点和普通核心节点,超级核心节点和普通核心节点的分工不同。比如,中国移动的超级核心节点负责中转省际流量、网间流量、国际流量交换等,普通核心节点负责中转省际流量、普通核心均与超级核心节点全互联。

2.1 SparkRTC随着华为公有云实现全球覆盖


SparkRTC基于华为公有云实现了全球覆盖,全球部署了2500多个服务节点,重点项目会针对项目诉求进行重点覆盖。国外采用公有云服务部署,互相备份容灾,区域节点多级容灾。海外可以部署到华为公有云服务的范围,目前华为公有云在海外已部署到曼谷、新加坡、约翰内斯堡、墨西哥城、圣地亚哥、利马、布宜诺斯艾利斯、圣保罗等,覆盖了多个国家和地区。但是海外节点中,不同国家会产生不同的延时,需要根据业务实际要求评估是否满足业务要求。


2.2 SparkRTC调度网络



SparkRTC的调度网络是ADN天路,也就是OverLay网络。调度网络ADN支持千级别接入节点,与硬件解耦,建设成本更低,离用户更近,可以实现100ms接入。不仅支持端和边到云端的网络加速,更提供端到端,边到边的加速能力。除此之外,ADN天路的覆盖区域更广,部署开通更加敏捷和灵活,不依赖运营商的物理专线。支持Internet与HBN网络Overlay混编加速路径。


华为云自建骨干网、网络协同提供精品高速网络,能够实现端管边云协同、无线加速:统一支持中国移动、联通、电信全国各省用户加速,统一支持5G切片、MEC下沉、4/5G QoS加速。另外,在手机端的APP上,按需调用无线网络加速能力,减少卡顿率22%。在公共互联网的基础上重构网络,自健骨干网100多专线、1000多运营商直连,节点全球覆盖、区域专线互通、运营商接入网络一跳接入。在控制面也采取了很多的措施,比如,基于全球网络质量状态提前预测和实时更新路由。在数据面,分段重传和冗余传输,多路径并行传输等。


其中就有私有抗网损算法在发挥作用,包括向前纠错算法、RE-RS嵌套纠错算法、自适应冗余、自动重传HARQ、AJB自适应抗抖动Buffer。智能调速,包括智能网络探测,根据时延和丢包率的关系,判断网络模型及可用带宽,控制编码速率与纠错方案。视频自动升降速,传输带宽降低或者恢复时,主动降低或恢复视频帧率、视频分辨率以及实时匹配当前带宽下最优视频质量。

2.3 H265+感知编码


华为云率先在业内提供了H265+感知编码技术,极大提升了用户体验。利用SVC可伸缩分层编码,包括时域分层、空域分层、质量域分层,视频以不同的码率、帧率、分辨率和视频质量解码,能够实现非常强的网络自适应能力。突出的H265+感知编码技术,能够实现高清低码,节省带宽成本,降低了30%-40%的码率,用户体验更佳。另外,实时超分技术,自动开启,把360P的视频提升至720P,但是码率不变,用户感受极佳。

华为云的SCC编码,特点是内容智识别、色彩高保真和辅流编码,视频流畅度效果帧率平稳在1080P/15fps,PPT出图时延极低,图文细节显示高清,在首先带宽景下用户体验流畅。

另外,音频自研算法深度配合,打造高可靠的音频体验。通过传统和AI回声算法结合,能够保证双讲场景不漏回声、不丢字,能够适应稳态环境,又能快速适应外部环境变化,快速收敛,支持更低信回比场景的回声抑制。另外,传统降噪和AI降噪结合可以同时抑制平稳和非平稳噪声,解决噪声收敛慢等问题,噪声抑制后相对传统降噪残留更少。结合AI-VAD降噪和自动增益精确人声检测,实现更好的降噪和自动增益效果,处理后信号更平稳,小信号响应更快更准确。


三、解决方案

华为云的SparkRTC全球一张网支持了E2E、E2DC、边缘加速服务三种主要的业务类型,在E2E类业务中,例如教育、协作等场景,端到端延时要求小于200ms;在E2DC类业务中,例如游戏加速、云桌面等场景,传输延时要求小于100ms;在边缘加速类业务中,比如分组对战游戏、渲染业务等,端到端延时要求小于30ms,考虑体验优先,采取就近服务的策略。

华为云实时音视频服务的核心亮点有三个,一是低延时媒体网络,二是高质量音视频、三是智能媒体处理。基于上述优势,华为云的SparkRTC能够实现音视频端到端延时小于200毫秒,全球部署了2500多个服务节点,全运营商覆盖,确保用户就近接入。能够自适应复杂的网络状况,能够扛住50%的视频网络丢包、80%的音频网络丢包。极致编码技术,支持1080P视频分辨率、H265+感知编码,能够在相同质量的情况下,把码率降低30%到40%。另外,AI特效玩法多,AI降噪效果好,AI调度提升了传输的可靠性。

场景一、教育类

利用华为云的SparkRTC可以轻松构建高品质互动教学体验,增强获客能力。能够满足小班课高画质、高音质的需求,满足大型直播课千人互动、自由连麦的需要,满足双师课堂稳定流畅、抗弱网低卡顿的要求。


场景二、文娱类

基于华为云的实时音视频服务,能够轻松打造“零距离”的互动直播间,比如主播才艺PK,创新玩法、升级体验,直播间内互动延时低于200毫秒,观众也可以实时互动。线上非诚勿扰,自由上线,高清画质,主播数量没有限制,无需提前安排,大家自由上线,连麦出镜。在线KTV,优质的音效、音频降噪,原生高保真,打造真实线下场景。


场景三、RTSA

在RTSA场景中,协同优势,保障极致体验和性价比。在互动过程中可以灵活配置音视频RTC参与方,构建实时音视频通许功能。


另外,在RTSA场景中表现出来的竞争力包括端到端延时小于800毫秒,百秒卡顿时长、首帧时延、拉流成功率,综合QoE体验更优,SLA可以达到99.99%。

结尾

华为云实时音视频服务(SparkRTC)全球一张网,凭借在视频业务领域长期技术积累,能够快速为各行各业提供高并发、低延迟、高清流畅、安全可靠的全场景、全互动、全实时的音视频服务,适用场景包括但是不限于在线教育、社交文娱、RTSA等。


本文整理自华为云社区【内容共创】活动第16期。

活动地址:https://bbs.huaweicloud.com/blogs/352652

任务12: 《全球低时延一张网的技术与业务》

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。