自动驾驶网络系列一:为什么需要自动驾驶网络?
“我们坚信,未来二、三十年人类社会必然走进智能社会。今天,人类社会正处于新理论、新技术再一次爆发的前夜。发展潜力巨大,但也存在诸多不确定性。很多问题依然存在,但开放创新是最好的解决之道。”
——经济学人:我们处在爆炸式创新的前夜任正非
任正非在经济学人发表的文章令人心情激荡,给我们展示了未来社会的无限可能。未来会是什么样子呢?我们可以大胆展望一下:
人工智能计算现在正处于高速发展时期,各种算法、功能令人眼花缭乱,但是未来的智能社会绝不是简单的几个算法的增强,而是一套社会基础设施的综合性的大变化,未来智能社会特征可以概况为C+C4核心技术。
第一个C是内容Content,智能首先是服务于人的,不论智能系统怎么发展,都是以为人类提供无限丰富的数字内容为目的。数字服务内容的极大丰富将是智能社会的最显著特征。
数字内容包括知识,信息,数据三种形式。数据是事物的数字量化描述,从数据中可以抽象出信息。信息是事物构成及组织形式的反映。而知识则是概念化的信息。最后可以根据知识和信息重构出数据,又输出反馈到现实世界。
我们当前的技术是以处理信息为主,而智能社会处理形式将向上下游扩展,向下则以处理数据为特征,现在的机器学习技术聚焦在这个领域,包括图像识别,智能仿真,智能推荐等等,抖音的智能变脸功能是这个技术最生动的展示。但智能也必将向上扩展,对知识进行处理,包括知识生产,知识推理,知识搜索,最近流行的知识图谱就是知识处理的基础技术,淘宝的智能问答,智能搜索展示了这种知识管理的应用前景。
当处理的内容扩展到数据和知识后,就会对现有的以信息为主的处理系统提出完全不同的需求。除了人类有史以来生成的知识是海量的,在底层技术上,智能社会会部署海量的传感器,从身体指标到工厂数据,从冰箱监控到安全视频,这些传感器会生成的是天量级的数据。这些数据首先就像任总说的需要太平洋一样宽的管道能力才能传送,对收集到的数据进行存储、处理能力都会有极高的要求,最后这些结果还需要大量控制机构输出到物理世界去执行。
所以智能社会和人类智能的记忆,思考,执行能力类似,也需要四种基础技术能力,即对应人类记忆的保存Conservation能力,对应人类思考的计算Computation能力,对应神经传递的通信Communication能力和对应**感知执行的连接Contact能力,简称C4能力。
就像同名的先进的C4高爆**,C4作为社会基础设施技术会对未来社会产生巨大的冲击,很多熟悉的东西在未来都会发生翻天覆地的变化。这些技术本身也在快速迭代,以Cloud为代表的(Conservation,Computation)能力基本上已经成型,而以5G为代表的通信能力,以IoT为代表的连接能力的还在快速发展,通信领域承担了与以往完全不同的责任,自身也必将发生巨大变化,那么这种变化是什么?要怎样应对?是每个愿意拥抱未来的通信人需要考虑和了解的。
我从事通信网络工作已经有20多年了,我看到了网络的逐步壮大,也切身感受了网络管理技术的艰难发展。在网络大变革的前夜,我看到了对网络进行革命性变化的可能性,最近一直在研究自动驾驶网络的相关问题,这里把自己的一些思考呈现给大家,请大家批评指正。
不抽象就不能深入思考,不具象就不能震撼心灵。
我很喜欢这句话,面对未来我们既需要高度的抽象洞察能力,看到发展的全景,也要脚踏实地,认真分析每个现实问题,逐步解决。我会从真实的维护场景讲起,再讲解决框架,最后讲述一下具体的演进实例。欲善其事,必利其器,我中间也着重讲了架构设计的一般方法论,如果没有合适的理论指导,我们是无法跨过问题带来的鸿沟,愿景就永远是愿景了。
1.1 网络管理现状急需改变
在畅想未来前,尽管大部分人现在使用网络是无感的,但是背后是一支默默的技术队伍在付出,有图有真相,看一下我拍的维护现场照片,先感受一下真实的维护场景。下图是一个非洲国家网络的交通环境,站点建在了一个别墅区中间,听起来很高大上的,但是奇怪的是到别墅区竟然没有一个平整的公路,地面是坑坑洼洼的裸露的铁矿石,最后一条路连越野车都不能通过,只有皮卡车才可以通过。这种交通环境实地维护是非常困难的。
上面是不发达国家的情况,发达国家呢,下图是一个发达国家拍的固网现场维护图片,左图的电话线还是用纸皮包的,一旦漏水就会全部废掉。右图是现场维护设备,是不是有种穿越回上世纪70年代的感觉。
我们再看看实际的维护过程,下图是实地考察的情况,除了现场的处理时间,大部分精力都消耗在路上,效率非常低下。
5个工单情况 |
处理情况 |
1.光纤误码 |
4个人两端现场定位,换光跳线解决,耗时90分钟。光纤准备不足,额外增加45分钟工作量。总计135分钟。 |
2.楼顶站被用户断电 |
电源柜锁被破坏,被业主断电,上电后恢复。耗时60分钟。 |
3.楼道小基站停电 |
现场检查发现市电故障,等待供电恢复。耗时80分钟。 |
4.路边小基站停电 |
现场检查发现市电故障,等待供电恢复。耗时50分钟。 |
5.传输板扩容 |
现场换板解决,耗时40分钟。 |
下表是电信网络典型维护效率数据,可以看出维护效率在不同项目体现出巨大差异,每个工程师维护的站点数量有近8倍的差距。
国家 |
故障/物理站·年 |
处理故障数/现场工程师·天 |
所有工单数/现场工程师·天 |
物理站/现场工程师 |
R国 |
0.4 |
0.35 |
0.7 |
196 |
J国 |
3.6 |
1.6 |
2.5 |
153 |
A国 |
7 |
0.6 |
0.8 |
25 |
从上面几个场景可以看出,通信行业比云业务环境差异更大,设备更分散,如何利用新技术让网络管理更简单是非常需要探讨的。
1.2 网络管理的未来挑战
具体的感受会限制我们的想象力,我们在更宏观的视角看一下网络管理的未来挑战是什么?
第一个挑战就是网络可用性与安全性要求越来越高,现在的网络越来越重要,中断了连钱都花不了,会影响点菜,打车,购物,就医,停车等各种生活。等5G来了,电力调度,工厂生产,车辆驾驶都靠网络,中断的影响有多大都无法想象。网络已经成为像水电一样的社会生活和生产的基础设施,一刻都不能停下来。还有未来的网络不像传统电话网和互联网是隔离的,网络未来会深度融合,针对一个承载大量高价值数据的网络,攻击、欺诈无疑会增加,伴随网络重要性的提升,强制管制会急剧增加。
第二个挑战是网络规模和复杂性会急剧上升。随着未来网络应用深入各个场景,网络规模会急剧加大,接触点更多,而且因为5G使用高频的原因,基站数量会10倍于现有规模,会有很多过去没有遇到的问题,例如在室内怎么标记站址。还有因为业务类别会非常多,eMBB,uRLLC,mMTC组网形态,结合实际的应用场景,会有千变万化的形态。通过切片来进行业务管理,业务路径也会随之更加动态和复杂。这些都会让网络管理难度大幅增加。
第三个挑战是现代营销要求网络提供灵活的业务发放能力,受限于网络服务能力,现在办理业务时还在依赖营业厅,很多实时业务还不能开展,比如玩游戏时,临时提升网络QOS等级,用户自己直接在手机终端DIY,需要网络端到端提供使能条件。
上面三个是网络本身的变化,在另一方面从人和企业角度也有很大挑战。
第一个挑战是人自身的维护能力受限,无论人多努力,人员掌握的信息,反应时间都是生理极限的,网络安全要求越来越高,但是人的反应时间是无法满足现代网络敏捷反应的需要的。如果没有系统的解决方案,单纯的增加人力也无法根本解决问题。
第二个挑战是人对工作环境会有更多要求,随着社会发展,企业人员会要求更好的工作环境,更便利高效的工具,大家可以从上面一些维护现场照片看,我们现在的维护条件其实非常恶劣,但是这种环境不可能持续,十年后的员工对工作环境的要求肯定要高得多。
第三个挑战也很现实,企业投入成本受限,电信行业成为基础设施了,但是电信的企业性质不会改变,作为企业会内在要求提升效率,运维投资一定会受投入产出限制,到时谁能够提升投入产出比,谁的产品就能在竞争中取胜。
自动驾驶网络不仅仅是网络管理系统的挑战,网络本身也需要相应的变化,网络如何能在高速转发过程中对性能进行度量,如何增强对物理故障的感知能力,如何支持网络管理的自动化控制,如何进行池化以便于灵活调动网络资源,如何融合环境数据以便于性能调优,都是自动驾驶网络需要回答的。
我们从具象到抽象都可以看出,网络的变革内在驱动力是很大的,小修小补的改进已经不能满足网络改进的需求了,要用架构性的创新,应对新网络的挑战……
本系列下一个章节我们看看自动驾驶网络架构设计方法,敬请等待更新!
- 点赞
- 收藏
- 关注作者
评论(0)