华为新一代企业数字化协作,有哪些黑科技?

举报
云科技时代 发表于 2018/10/09 19:18:18 2018/10/09
【摘要】 华为在全球170多个国家和地区拥有1023个办公室,这背后正是高效敏捷的数字化IT平台,支撑了全球化高效运营。


3a0a352253ad4741af64052aec95d0e2.jpeg


华为在全球170多个国家和地区拥有1023个办公室,这背后正是高效敏捷的数字化IT平台,支撑了全球化高效运营。对于华为来说,高效的沟通与协作在企业的生产过程中发挥着举足轻重的作用,支撑着华为分布在全球超过18万名员工及合作伙伴协作,完成了华为在2017年超过6000亿人民币的销售收入、2018年上半年同比增长达到15%的业绩。

2018年9月,在华为企业通信CloudLink新品发布会上,发布了包括会议终端CloudLink Board、编码器CloudLink Box、专业智能导播CloudLink Bar等在内的协作智真系列产品,全面引领企业通信与协作迈入智能时代。CloudLink系列新品凝聚了华为办公IT数字化转型的经验,重新定义企业通信方式,将企业带入全新的协作时代。那么,CloudLink背后都有哪些黑科技?

人工智能掌控全场


f1861ba7aaa040828e8e2a06eb8f3334.jpeg


(上图:基于人脸识别的电子铭牌)

如何让员工能够提升会议体验及效率,成为华为企业数字化转型的关键任务之一。如今,华为在全球共计部署了7300套视频会议系统,平均每天有7万4千场视频会议召开。2017年,华为专门成立了“数字化会议变革项目”,旨在用最新的数字技术来重新定义会议。

华为全新一代CloudLink系列产品,不仅仅体现了华为公司对未来数字化、智能化的探索创新,更是紧密结合了数字华为的优秀实践,以及诸多人工智能等诸多黑科技。

黑科技一:智能语音会控。传统视频会议系统对于管理者来说是比较复杂的键控方式,而将人工智能技术集成进来,通过语音智能控制会议系统,完成会议发起及结束、会议成员添加、静音、画面切换、材料共享、音量调节等所有会控管理,可大幅简化会议操作复杂度,提升用户体验。CloudLink协作智真系列产品内嵌智能助理“小微”,综合运用语音助手、语音唤醒、远场拾音、语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)等多项关键技术,实现高准确率语音会控。CloudLink通过对不同回声和双讲等场景进行调优,提高会议室声音信噪比,从而让“小薇”听得清语音;同时采用业界最高语言识别能力的神经网络算法,对常用指令进行几十万种说法训练,让“小微”听得懂语音指令。

黑科技二:基于人脸识别的电子铭牌。在传统会议中经常会出现参会人员互相不清楚其它参会人员姓名、所在单位或部门以及其它必要信息,因此需要在会前做自我介绍,但往往又难以在短时间内记住所有的信息,这就给沟通交流带来不便。如果会议系统能自动识别参会人,给出铭牌显示,就可以避免参会人员互不认识的尴尬场面。CloudLink协作智真系列产品支持基于人脸识别的电子铭牌,运用动态场景分析算法和业界最高水准的人脸识别算法,基于内置AI处理器的强大处理能力,完成人脸检测、人脸跟踪及人脸识别,提供实时电子铭牌,最远识别距离超过12米。

黑科技三:智能导播。在传统会议中,对发言人跟踪、场景切换等导播动作都是依靠专业人员手工操作完成的。而会议画面呈现效果,也依赖于导播人员的反应速度和准确性。现在,将人工智能技术运用于会议导播,可实现发言人精准定位及自动跟踪、个人特写/双人对话/全景总览三种画面自由选择等智能导播功能。CloudLink协作智真系列产品支持基于声音+图像双重定位的智能导播,首先采用声源定位算法,准确判断声音方向;然后通过人脸检测和三维定位算法,精准判断发言人位置,可准确区分肩并肩的不同发言人;自动估算发言人距离,智能调整PTZ(pan/tilt/zoom)变焦倍数,输出发言人最优画面;智能区分单人/双人交替/无人等不同发言场景,在个人特写、双人对话、全景画面之间进行流畅切换,呈现最优的会议体验;特别是提供了5倍光学变焦、8M的导播距离,可满足专业级导播要求。

增强沉浸感的音视频体验


92dbb380bdb54ee698bca0cec6fed78f.jpeg


(上图:核心ISP图像处理算法效果对比)

CloudLink系列产品被称为“协作智真”,其中“协作”指的是会议与协作融为一体,让企业的交流更加高效、自由;而“智”代表的是人工智能,让企业通信与人工智能充分融合到一起;“真”体现的则是从高清到极清,这种清晰度上的提升了用户在远程会议中的带入感和沉浸感,也让企业通信的应用场景更加广泛。

黑科技四:H.265编解码+活动图像增强VME(Video Motion Enhance)“双核”处理技术。在视频会议中,视频体验与网络带宽往往是矛盾的两面。然而,视频的清晰度是视频会议能否带来更自然体验的重要指标,企业一直在追求从标清到高清、再到4K极清,甚至4K30极清流畅视频体验。为了得到广泛的应用,必须解决网络带宽限制的问题。如何实现低带宽条件下4K30效果,是行业公认的难题。

CloudLink协作智真系列产品采用H.265编解码+自研活动图像增强VME(Video Motion Enhance) “双核”处理技术,实现了2Mbps带宽下4K30极清流畅视频效果。其中,内置强大的硬编解码器,支持64*64的宏块结构编码和RQT自适应块结构技术,更多复杂预测算法及并行化方式计算,最高可实现双路4K30极清视频;同时运用基于运动检测的智能时域、空域视频滤波降噪算法,使图像还原PSNR提升7.18%;运用ROI技术,智能区分人眼感兴趣的人脸、皮肤等区域以及及背景、大幅纹理等人眼不感兴趣区域,将有限带宽应用到人眼感兴趣部分;通过后图像处理增强技术,可根据每帧图像特征自动分析出每个像素的滤波强度,消除块状效应,保留更多的图像细节。

黑科技五:核心ISP图像处理算法。如今,视频编解码技术已经发展到H.265, 其编码效率比上一代H.264HP又提升了近30%。但高度压缩的图像在还原后,难免存在失真,尤其在人眼感敏感的边缘区域、色彩丰富性、光线阴暗区域等方面,很容易被人眼感知出来。后期图像处理的结果,将直接影响被还原图像的逼真度。CloudLink协作智真系列产品采用核心ISP图像处理算法,可将图像边缘清晰度提升20%,颜色准确性提升100%;运用自适应清晰度增强技术ADE,准确还原真实世界每个点的灰度,提升图像边缘清晰度;精确色彩还原技术(ACR)可智能拓展颜色空间,让画面色彩更丰富;基于人眼图像宽动态WDR技术,可支持感光器件像素级亮度控制,让图像亮度还原更真实。

黑科技六:超强纠错技术SEC3.0。基于互联网的视频会议已成为主要的工作方式,随时随地开会是企业的基本需求,但由于互联网带宽不稳定性,视频会议经常出现声音断续、画面模糊,甚至中断的情况。网络的不稳定性、视频会议解决方案的网络传输纠错能力,直接影响到系统网络适应性,从而影响到视频会议的沟通协作体验。CloudLink协作智真系列产品支持音视频超强纠错技术,具备超强的网络适应性:在视频方面,综合运用ARS网络模型检测、HARQ超强丢包重传、SEC3.0前向冗余算法、AJB技术和适应秒级网络延迟及抖动等技术,实现视频抗丢包率达到30%;在音频方面,采用可变码率编码、NetATE网络适应性技术、前端FEC及RED抗丢包算法和后端PLC处理,可实现音频抗丢包率达到70%。

极致体验扩展协作空间


f8ba682511c7418a9b1271880d5fbf7b.jpeg


(上图:前向智能波束拾音+后向“音幕”)

华为新一代CloudLink企业通信解决方案主要希望帮助企业达成数字化办公空间、智能化工作方式、行业化生产使能三个核心目标。在行业化生产使能方面,根据IDC报告,华为视讯系统和终端已经连续五年在中国市场排名第一,在政府、公安、教育、医疗、金融、轨道、交通、电力等大行业,以及教育、互联网金融等行业,已经具有较高占有率。

在已经有的市场份额基础上,如何进一步拓展新的行业协作空间?这就必须要创造更极致的体验,才能打开新的空间,这其中就包括更远的拾音距离、更精准的音源定位、更高清和更细腻的图像与视频捕捉。

黑科技七:前向智能波束拾音+后向“音幕”。CloudLink协作智真系列产品采用智能波束拾音技术+后向专用MIC滤噪技术,正面利用12个全向MIC,使用Beamforming技术,形成多个拾音波束;通过多个拾音波束,可提高信噪比,提升远距离拾音效果,同时通过增强去混响能力让声音更清晰,还能根据智能切换算法来选择最优声音效果的音频数据对会议音频进行增强处理。什么叫0.5度音源精准定位?也就是运用高性能定位算法,可对在6米距离、水平相差5cm的两位发言人,进行精准的音源定位。而除了正向MIC外,还在背部部署后向降噪MIC,形成可屏蔽后向干扰声音的“音幕”。

黑科技八:5K极清摄像。高清视频作为一种主要的沟通方式,已经在各行各业得以普遍应用。而在医疗、精密设计等高端设计行业,需要更高分辨率摄像设备、更好感光元器件,才能确保图像采集足够清晰、细节足够丰富,环境适应性足够强,从而为行业应用提供更清晰地图像呈现。CloudLink Board产品采用集成了5K分辨率摄像头,1英寸光照面、2.4um感光单元CMOS等核心元件的极清摄像方案,可让单位像素进光更充分、画面噪点更少、基础图像更清晰更细腻,结合华为针对自研ISP算法及专有ISP处理硬件,达到震撼的画面效果。同时,CloudLink Board产品还可支持7680X4320的8K分辨率,8K分辨率相当于4倍4K分辨率以及16倍全高清的分辨率,也是目前显示领域应用到的最高分辨率,超过了大多数单反相机的像素值。

有了更远的拾音距离、更精准的音源定位、更高清和更细腻的图像与视频捕捉,这实际上相当于大幅增加了企业对环境的认知能力,特别是对于人工智能应用来说,打开了全新的价值空间。目前的人工智能,已经在声音识别、图像识别和视频识别方面达到了成熟商用的程度,结合CloudLink系列产品更高清的声音、图像和视频输入数据,就有机会把用于内部协作和运营的视频会议工具转型为企业创造价值的新平台。

数字化转型衍生出很多新的行业机会,企业通信正在从成本节约变成价值创造中心,比如远程教育、远程医疗、远程庭审、远程提讯等,这些都促成了一个新的生产方式,被称之为远程经济。而高分辨率的声音、图像和视频,也是Gartner所提出的数字化转型的分辨率革命,即更丰富的捕捉物理世界的信息并数字化,可能带来重塑行业的机会。

华为中国区企业云通信解决方案销售部总经理彭晓东表示:“随着企业数字化转型深入、云和AI技术的成熟应用,我们正进入全新的协作时代。”而在全新的协作方式下,原先用于辅助内部协作和沟通的视频通信系统也在转型成为企业的生产力工具。CloudLink协作智真系列产品把所有联接汇聚到云,为企业员工和组织提供无处不在的联接,其背后的八大黑科技让员工和组织之间的协作更高效、更专注、更简单、更安全、更极致,进而打开数字化创新的空间,接下来就有赖于生态伙伴一起,共同把数字化产业的蛋糕做得更大。(文/宁川)


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。