这一次,我们撞线了

举报
技术火炬手 发表于 2019/12/16 14:50:41 2019/12/16
【摘要】 要做到绝对领先,先要做到:我们不一样!

有位名人说过,“好奇心造就科学家和诗人。”我不是诗人,也不敢自称科学家,但我十多年的研究生涯正是由好奇开端的。

读研期间,我的专业领域是光纤通信,同时也接触到一些基础的通信信号处理算法,这些算法主要用于无线和铜缆,在光通信领域并没有算法的研究和应用。我非常奇怪,为什么光通信就不研究算法呢?咨询导师,没找到清楚的答案;环顾国内,没有研究团队;搜索业界,也没有相关产品。

带着这个疑问,我一头扎进了光通信系统算法的研究。

错过与坚持

“要做到绝对领先,先要做到:我们不一样!”

光通信,顾名思义就是利用光波来传递信号的通信方式。在光通信早期,每秒传递10G、40G的信息,远小于光纤的实际带宽,因此不需要算法处理就能实现光信号的长距离传输。这就好比在一条宽敞的道路上,车辆少且速度慢,压根用不着算法。但车越来越多,速度越来越快,到了每秒传递100G信息时,没有算法处理的话就容易“翻车”。

2007年初,我从北京邮电大学博士毕业,加入华为一个刚成立一年多的新部门——传送产品线研究部,从事下一代高速光通信系统算法的研究和创新。我们面对的第一个挑战就是100G相干系统的算法研究和应用。

怎么定义波分产品是领先的?客户的要求很简单:管道要粗,传的容量尽量大;还要长,传的距离要远。这跟水管的要求是一样的,水流量要大,而且要流得远。具体到我们团队的工作就是:研究信号处理算法,让波分产品的容量和距离这两个指标最大化,绝对领先对手。

经过一段时间的摸索,我们研究出一套方案。但为应对竞争,产品线也招聘了一些业界“明白人”来和内部研究团队进行“赛马”,他们在这个领域经验丰富,提出了更有优势的技术方案,产品线最终拥抱了他们的方案。我们有些失落,但也正视差距,奋起直追,随后我们也研究出“二代软判”FEC方案,大幅度提升了100G波分产品的传输距离。此后很长一段时间,大家都是在100G算法基础上进行各种优化改进,从产品角度也很有价值,但对我们研究团队来说,总期望有更创新的方案,能对产品竞争力做出更大的贡献。

随着100G的普遍商用,200G的代际演进提上了日程。从100G升级到200G,如果基于教科书上的演进方式,可以实现容量翻番,但传输距离将从原来的上千公里断崖式下降到几百公里,无法满足波分系统的代际演进诉求,即:容量翻番、距离不变、成本不变。全世界的技术团队都遇到了这个难题。在长途波分领域,我们在市场上一直是领先的,在技术上则是你追我赶,交替领先。因此在100G到200G的代际演进中,谁能实现突破,取得领先就尤为关键。

面对容量翻番后,传输距离大幅度下降的问题,我们一直在探索更好的解决方法。2013年,通过调研,我们探索到一个算法方案对传输距离有明显提升,但是在代码仿真的过程中,却始终无法验证方案的理论增益。当我们在困境里苦苦挣扎的时候,德国一所大学发表了类似算法的研究成果。我们发现只需要调整算法处理的先后次序,就能得到想要的性能增益,这真是让我们百感交集。虽然我们花了很多心血在这个方案上,但很遗憾,最后我们没有得到撞线的机会。

在该算法方案的论文被公布后,全世界研究团队几乎都跟进了这个技术方向,各种改进优化方案此起彼伏,迅速成为业界新一代算法研究与应用的主流方向。虽然在工程开发进度上各个公司有差异,但由于在技术方案选择上趋同,可以预期最后的产品规格很难有太大的差异。对波分产品来说,技术方案上的趋同必然导致在产品规格指标上的趋同,那怎么实现绝对领先呢?面对公司在特殊时期对技术领先的要求,“Better & Cheaper”不能再成为我们的选项。我们要不一样!  通过技术方案的差异化来支撑产品的绝对领先,应该是我们技术研究团队的核心价值。

1976年的论文

 “在CT领域,也许很难再有‘天外飞仙’似的创新了, 当你找到一条可能的技术路径的时候,注定是困难重重的,甚至可能都有人倒在路边了,你走不走? 这样的情况几千年前就有人面对过: 破釜沉舟,百二秦关终属楚。”

要体现研究团队的价值,就要在业界常规的技术路线之外探索差异化且性能更好的技术方案,这也是我们的追求。差异化的技术方案,换句话说就是要创新,这个事情说起来容易,做起来会遭受到无数的质疑。”一个战略产品的关键技术方向,业界都认为做不出来,凭什么我们就能做出来?”到现在为止,这依然是在华为质疑创新的一个天问。但业界都认为能做到,华为还有多少绝对领先的机会呢?

技术研究的一个常规手段,尤其是CT领域,就是去看看前人做过什么。整个团队浏览分析了几十年来业界数百篇的论文。我们从最近的论文开始看起,不断往历史深处推进,终于在卷帙浩繁的历史文献中,通过一篇1976年的技术论文,发现一个原始思路。论文只是一个纯理论的数学推导,但它从数学原理上证明存在一个具备理论优势的方案。通过对几十个数学公式的反复推演,我们在吃透了理论后,开始撰写代码搭建仿真平台,基于仿真结果确认此方案可以提升性能,在关键指标上能大幅超越业界现有方案。于是我们依托方案基本架构申请了专利,并在公司第一届十大 发明评选中,获得第二名,这极大的鼓舞了我们的信心。

但是能否落地为真正的产品商用,我们自己也还有很多疑惑。为进一步解答这些疑惑,我们在各种学术会议上和业界专家进行了广泛交流。有人说这个技术值得研究,大部分专家都说工程实现难度太大,可行性低。我们经过多轮的反复分析和讨论,认为虽然工程难度很大,但是不存在理论硬伤,工程上的困难是可以慢慢解决的。于是团队主要的成员都投入该方案的技术攻关中,希望能解决该方案在工程应用上的多个难点。

在研究了一年多以后,恰逢产品有新一版芯片的规划,自然期望新方案能够落入产品。但是经过激烈讨论,产品线还是认为我们的方案不够完善,距离落地产品芯片还有一段距离,因此没有选择我们的方案。虽然我们已经把一堆数学公式变成了一个比较接近产品原型的算法,但它还有一些关键问题需要解决,还需要更细致的打磨和改进。

此时我们团队面临着极大的压力,这条技术路线是否继续坚持下去?产品关注的工程难题是否最终能被我们解决?是不是这个方向真的走错了?对我们来说,实际上已经无路可退了,经过这么长时间的投入和努力,已经走在半山腰上了,只能破釜沉舟向前冲。部门主管也非常支持我们,他认为就算方案最后没做成,但是如果能排除产品线在技术路线上错漏的风险,也是有价值的。他一直鼓励我们不要顾虑太多,好的方案天然就有生命力,迟早会被识别出来的,同时也要求我们按照产品工程约束,全力攻关技术困难。

这一次,我们撞线了

    “做技术研究能最后撞线,不是因为跑得快,是因为能坚持。能坚持,是因为曾经错过”

回到技术方案的工程约束上,最大的困难就是时钟恢复。由于方案设计的特殊性,常规的时钟恢复方案无法应用。针对这个技术点我们咨询了公司内外很多专家,普遍都认为难度太大。这个技术难点成为整体方案的瓶颈,这点过不去,整个方案也过不去,就要被拖死在这里,这就成了我们的一个关键突破点。

其实早在两年前,我就意识到这个问题,安排了小万同学主攻这个技术点,为什么选他做?因为他在我们团队中对数字逻辑和硬件时钟有相对较多的积累,进入到这个领域后没多久他发表感想:“感觉也不是完全不可能啊。”我们实在太需要他这种“感觉”来给我们信心了,但感觉归感觉,真正要走通这条路也是困难重重。

高速通信系统时钟恢复这个领域前人也有很多的研究,论文不少,但是真正在工程领域做芯片时钟恢复的专家很少公开他们的成果。对我们研究团队来说,看论文、走出去和业界专家进行面对面交流,永远是做研究的第一步。前人的研究论文中关于时钟恢复的算法有十几种,每种他都要去分析、改进,看是否匹配我们的系统。光这项工作就做了一年多,进度是比较慢的。但这就是研究的特质,需要时间来探索、沉淀和积累。

有一次,他去国外 参加一个学术会议,在交流当中讨论到时钟恢复这个技术方向,在交谈中受到了启发,他回去后又去查找相关论文,论文提出的思路和他之前分析过的一个方案可以结合。他通过初步仿真验证后,发现在原理上是可以实现的,只不过还需要做更深入的优化和参数匹配设计。研究到这里,穿过这个技术难题的大门钥匙基本就让他找到了。在此之前,我们面前就是一堵墙,在墙上摸索了快两年的时间。说幸运也好,说机会总是偏爱有准备的人也好,这个技术难点总算攻下来了。在问题没攻克之前,他连续做了两年“冷板凳”,当然,后来给他迅速升级提拔了。

当最核心的困难解决后,其他的问题也顺理成章地解决了,最终依托我们创新方案的新一版芯片立项,支撑了200G长途波分代际演进,助力新一代波分产品在传输性能上绝对领先。

级别有高低,技术无大小

“级别有高低,但技术上是没有大小的。技术一定是有客观对错的,它不像艺术上的东西,是主观的,辩不清楚的。”

我们团队是做研究工作的,70%都是博士,其余是硕士。公司现在流行的称呼是博士军团,怎么让博士团队的博士硕士充分发挥价值?俗话说“水无常形”,不同技术领域的差别很难总结出一套普遍适用的方法。从我个人经验来说,要带好博士军团,最好领头人也是博士。这样能比较容易理解他们在进公司后,在各种事情上的反应和情绪。比如公司文化解读、内部赛马机制、商业导向传递、压力疏导和沟通等。我个人也是这么走过来的,经历得多一些,就可以和团队的兄弟们分享,尽量从客观理性的角度去和他们达成共识 。

博士军团的带头人一定不能靠组织权威,去压制团队成员的各种意见,不能因为有考评关系,理所当然觉得别人就得听我的。级别有高低,但在技术上是没有大小的。技术一定是符合逻辑,有客观结论的,它不像艺术上的东西,是主观的,辩不清楚的。因此要用技术价值去做沟通,推动博士军团成员理性接纳和尽量发挥他们的主观能动性。

在公司做研究和高校还是有很大的差别,涉及不同的技术领域也是千差万别,我们在产品线做研究一定要理解产品的商业诉求。商业诉求是比较直接的,一般很难从技术维度考虑得很全面,技术团队应该考虑怎么尽最大的努力去触及这个商业诉求,而不是去对抗。全力以赴去够这个目标,不一定能够达到,但求上得中,求中得下。你要相信,你拼尽全力没做成的事,别人也没那么容易能做成功。

换个角度看,研究团队自身对技术规格和技术方案的判断也要有定力,要坚持自己的技术逻辑,也要有勇气为自己的技术逻辑承担责任。

我在这个领域已经研究了十几年,常常感觉走在悬崖边,总担心自己错过了好的思路和方案,担心自己的技术判断出错,也总想着怎么把产品的技术规格做得更好一点。虽然压力很大,但我希望我们团队能在这个领域能做到世界最好,给客户和公司带来价值,成就客户、也成就团队,这是推动我能持续走下去的动力。

研究没有终点,200G的硝烟刚刚消散,400G的战场已然风起狼烟。剑已出鞘,这场战役相信我们也能漂亮撞线,达成产品在新速率维度上持续领先,绝对领先的远大目标。

image.png

1576478913787127.gif

本文为《华为人》版权所有,未经允许不得转载。如需转载请联系编辑部hwrb@huawei.com


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。