- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【云驻共创】全球低时延一张网的技术与业务

liuzhen007 发表于 2022/05/25 22:55:15 2022/05/25

4.9k+ 0 0

【摘要】华为云SparkRTC基于一张专业和强大的实时音视频网络，致力于为全球提供实时音视频服务，帮助客户快速获得音视频通话、互动直播等能力。同时，华为云视频团队聚集了音视频通讯领域的顶尖人才，在视频、音频领域拥有30年的技术积累，打造出最专业的实时音视频产品和服务，并多次应用在大型多国联合会议中。华为完全自主研发，在音视频处理、网络自适应、平台兼容性方面达到了业内领先水平。目前，华为云视频产品提供了非常

一、业界趋势

当前，很多云上业务产品都在面临着三大挑战，首先是内容码率的提升，为了提升用户体验，需要提升对应的视频画面质量，之前720P的视频画面要求2M左右的网络带宽，1080P的视频画面要求4M左右的网络带宽。随着4K和VR业务场景的需要，对网络带宽和视频码率都提出了更高的要求，比如VR场景要求每秒80M的网络带宽，之前720P视频画面的带宽的40倍。其次是低时延实时互动，现在已经进入到毫秒级延时时代，实时互动数据占比预计到2025年，将从2020年的8%上升到30%，超低延时的实时互动应用场景将成为未来社会的主流。还有就是伴随而来的端侧算力上云，由于数据量的激增，数据和算力逐步向云和边缘计算转移。预计到2025年，终端模块的数据和算力将由2020年的65%下降到50%，相应的云端和边缘计算将分别上升5%和10%。

1.1 多媒体内容上云的4大关键驱动力

1. 内容质量升级，算力诉求激增

内容质量升级，算力诉求激增，传统工作站模式已经无法满足日益增加的需求。举一个例子，2009年上映的《阿凡达》的特效镜头是1600个，到了2019年上映的《阿丽塔》的特效镜头是2600个；前者的面部捕捉数是830个，后者的面部捕捉数是2500个；前者的单帧渲染时长是100小时，后者的单帧渲染时长是500小时；前者的总渲染时长是1.5亿个小时，后者的总渲染时长是4.3亿个小时；前者使用的制作服务器数量是2000台，后者使用的制作服务器数量是30000台；前者的存储大小是1PB，后者的存储大小是4PB。以上数据足以说明内容数据量激增的现实趋势。

2. 实拍到数字化的直接生成的需要

当下比较流行的虚拟数字人，比如华为云的“云笙”；虚拟拍摄也逐渐成为主流，比如《头号玩家》就是使用的虚拟拍摄；还有虚拟演唱会也非常热门，比如《堡垒之夜》。

3. 机器取代人工

机器取代人工，AI自动化成为社会发展进步的趋势。当前很多行业70%的成本投入在人工上，这样状况会导致项目周期长、成本高、效率低。比如，国内影片拍摄70%的费用用在了演员身上，而对比好莱坞只有25%。相信未来，国内影视拍摄的成本分配比例也会逐步合理化。

4. 远程协作、生产制作效率提升

远程协作、生产制作效率提升，行业分工细，工序杂，分包多，异地协作要求高，比如好莱坞特效大片制作的过程涉及到数十家公司、上千人的制作团队。包括编剧、拍摄、动捕、模型、动画、特效、剪辑、色彩、声音、合成等。如果引入超低延时的实时通讯协作模式，将大大降低沟通成本和制作成本。

1.2 SparkRTC的优势

说到华为云音视频服务，很多人可能会感到陌生。其实，华为云音视频服务最早可以追溯到上世纪八十年代，1988年华为就已经向大众提供通话服务，当时华为具备国内一流的音频引擎和一流的音视频网络技术。到了2004年，华为开始对外提供视频业务，其中，包括先进的H.265编解码、最佳的VR/AR技术、一流的直播CDN能力以及对超高清分辨率的支持等。2008年，华为推出了视频会议产品，同时申请了很多相关的技术专利，包括UDP协议、抗丢包算法，另外，还具备业内一流的3A算法保证视频会议的音频质量。2017年，华为云正式上线，搭建了海量的边缘节点和CDN节点。华为云音视频服务的目标是长期专注于音视频极致体验的持续提升，引领行业发展。

二、SparkRTC全球一张网

华为云的SparkRTC全球一张网是整个音视频实时通讯服务的基础，任何网络服务都离不开物理网络的支持，也就是UnderLay网络。比如我国的三大骨干网络，电信Chian Net、联通China169、移动CM Net，它们都分为超级核心节点和普通核心节点，超级核心节点和普通核心节点的分工不同。比如，中国移动的超级核心节点负责中转省际流量、网间流量、国际流量交换等，普通核心节点负责中转省际流量、普通核心均与超级核心节点全互联。

2.1 SparkRTC随着华为公有云实现全球覆盖

SparkRTC基于华为公有云实现了全球覆盖，全球部署了2500多个服务节点，重点项目会针对项目诉求进行重点覆盖。国外采用公有云服务部署，互相备份容灾，区域节点多级容灾。海外可以部署到华为公有云服务的范围，目前华为公有云在海外已部署到曼谷、新加坡、约翰内斯堡、墨西哥城、圣地亚哥、利马、布宜诺斯艾利斯、圣保罗等，覆盖了多个国家和地区。但是海外节点中，不同国家会产生不同的延时，需要根据业务实际要求评估是否满足业务要求。

2.2 SparkRTC调度网络

SparkRTC的调度网络是ADN天路，也就是OverLay网络。调度网络ADN支持千级别接入节点，与硬件解耦，建设成本更低，离用户更近，可以实现100ms接入。不仅支持端和边到云端的网络加速，更提供端到端，边到边的加速能力。除此之外，ADN天路的覆盖区域更广，部署开通更加敏捷和灵活，不依赖运营商的物理专线。支持Internet与HBN网络Overlay混编加速路径。

华为云自建骨干网、网络协同提供精品高速网络，能够实现端管边云协同、无线加速：统一支持中国移动、联通、电信全国各省用户加速，统一支持5G切片、MEC下沉、4/5G QoS加速。另外，在手机端的APP上，按需调用无线网络加速能力，减少卡顿率22%。在公共互联网的基础上重构网络，自健骨干网100多专线、1000多运营商直连，节点全球覆盖、区域专线互通、运营商接入网络一跳接入。在控制面也采取了很多的措施，比如，基于全球网络质量状态提前预测和实时更新路由。在数据面，分段重传和冗余传输，多路径并行传输等。

其中就有私有抗网损算法在发挥作用，包括向前纠错算法、RE-RS嵌套纠错算法、自适应冗余、自动重传HARQ、AJB自适应抗抖动Buffer。智能调速，包括智能网络探测，根据时延和丢包率的关系，判断网络模型及可用带宽，控制编码速率与纠错方案。视频自动升降速，传输带宽降低或者恢复时，主动降低或恢复视频帧率、视频分辨率以及实时匹配当前带宽下最优视频质量。

2.3 H265+感知编码

华为云率先在业内提供了H265+感知编码技术，极大提升了用户体验。利用SVC可伸缩分层编码，包括时域分层、空域分层、质量域分层，视频以不同的码率、帧率、分辨率和视频质量解码，能够实现非常强的网络自适应能力。突出的H265+感知编码技术，能够实现高清低码，节省带宽成本，降低了30%-40%的码率，用户体验更佳。另外，实时超分技术，自动开启，把360P的视频提升至720P，但是码率不变，用户感受极佳。

华为云的SCC编码，特点是内容智识别、色彩高保真和辅流编码，视频流畅度效果帧率平稳在1080P/15fps，PPT出图时延极低，图文细节显示高清，在首先带宽景下用户体验流畅。

另外，音频自研算法深度配合，打造高可靠的音频体验。通过传统和AI回声算法结合，能够保证双讲场景不漏回声、不丢字，能够适应稳态环境，又能快速适应外部环境变化，快速收敛，支持更低信回比场景的回声抑制。另外，传统降噪和AI降噪结合可以同时抑制平稳和非平稳噪声，解决噪声收敛慢等问题，噪声抑制后相对传统降噪残留更少。结合AI-VAD降噪和自动增益精确人声检测，实现更好的降噪和自动增益效果，处理后信号更平稳，小信号响应更快更准确。

三、解决方案

华为云的SparkRTC全球一张网支持了E2E、E2DC、边缘加速服务三种主要的业务类型，在E2E类业务中，例如教育、协作等场景，端到端延时要求小于200ms；在E2DC类业务中，例如游戏加速、云桌面等场景，传输延时要求小于100ms；在边缘加速类业务中，比如分组对战游戏、渲染业务等，端到端延时要求小于30ms，考虑体验优先，采取就近服务的策略。

华为云实时音视频服务的核心亮点有三个，一是低延时媒体网络，二是高质量音视频、三是智能媒体处理。基于上述优势，华为云的SparkRTC能够实现音视频端到端延时小于200毫秒，全球部署了2500多个服务节点，全运营商覆盖，确保用户就近接入。能够自适应复杂的网络状况，能够扛住50%的视频网络丢包、80%的音频网络丢包。极致编码技术，支持1080P视频分辨率、H265+感知编码，能够在相同质量的情况下，把码率降低30%到40%。另外，AI特效玩法多，AI降噪效果好，AI调度提升了传输的可靠性。

场景一、教育类

利用华为云的SparkRTC可以轻松构建高品质互动教学体验，增强获客能力。能够满足小班课高画质、高音质的需求，满足大型直播课千人互动、自由连麦的需要，满足双师课堂稳定流畅、抗弱网低卡顿的要求。

场景二、文娱类

基于华为云的实时音视频服务，能够轻松打造“零距离”的互动直播间，比如主播才艺PK，创新玩法、升级体验，直播间内互动延时低于200毫秒，观众也可以实时互动。线上非诚勿扰，自由上线，高清画质，主播数量没有限制，无需提前安排，大家自由上线，连麦出镜。在线KTV，优质的音效、音频降噪，原生高保真，打造真实线下场景。

场景三、RTSA

在RTSA场景中，协同优势，保障极致体验和性价比。在互动过程中可以灵活配置音视频RTC参与方，构建实时音视频通许功能。

另外，在RTSA场景中表现出来的竞争力包括端到端延时小于800毫秒，百秒卡顿时长、首帧时延、拉流成功率，综合QoE体验更优，SLA可以达到99.99%。

结尾

华为云实时音视频服务（SparkRTC）全球一张网，凭借在视频业务领域长期技术积累，能够快速为各行各业提供高并发、低延迟、高清流畅、安全可靠的全场景、全互动、全实时的音视频服务，适用场景包括但是不限于在线教育、社交文娱、RTSA等。

本文整理自华为云社区【内容共创】活动第16期。

活动地址：https://bbs.huaweicloud.com/blogs/352652

任务12: 《全球低时延一张网的技术与业务》

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

作者其他文章

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

开发者空间

了解空间

工作台

开发工具

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务