【华为人】——单板赤子心

举报
技术火炬手 发表于 2018/08/09 09:33:25 2018/08/09
【摘要】 2018年8月8日,对于大多数人可能是北京奥运十周年的纪念日。但这对于我来说,还有特别的意义,因为就是这一天我与华为结缘,这一天我通过了面试,进入了华为……

 

提到2008年8月8日,很多人第一反应是北京奥运会,但是这一天对于我来说还有特别的意义,这是我参加华为面试的日子,我第一次真正走进华为正好就是这一天。如今一晃都已经十年了,身边的兄弟换了一批又一批,而我还沉在单板领域,几经变幻浮沉,骨子里还保持着对单板的赤子之心。     
   

首战挫败,我动了离职的心

我进入华为后第一个部门是城域以太硬件开发部,当时整个团队不到十人,我的工作是做生产维护,在师傅老杨、天明、老牛的指导下往返产线,分析定位故障单板,看多了别人的板子,我就会想要是我来做,我会怎么做,这些问题会不会在我的板子上出现?其实当初我加入华为时就怀揣着一个小目标:我一定要做一块真正属于自己的单板。


半年后,由于业务调整,我跟随团队到来南京,我参与的第一项任务就是配合项目组MDE老孙针对一款海量发货单板做降成本开发,我很高兴我终于能画板子了,我觉得离自己的目标又近了一步。没想到这带来了我职业生涯的第一次挑战,也让我险些离开了华为。


那是交换机产品第一款大卖的盒子,当时每年已有几十万的发货量,是我们整个产品的现金牛,产品线立了专项项目组,希望能把这款盒子的成本做到极致。兄弟们一起想了很多方案,从器件、工艺、互连和结构各个领域都充分挖掘降成本措施,并挑战成功了多个产品交付的“第一次”:第一次实现单面布局,第一次实现多款整机共PCB、共结构件设计,第一次走EMS试点联合交付。项目最终如期交付,成本降低了接近40%,我们几个新人欣喜若狂。本以为就此划上了圆满的句号,不想真正的挑战才刚刚开始。在上量了两万多台之后,突然出现了网上问题。发货量已经上去了,如果不能快速定位到问题并解决,那后果是不堪设想的。大家开始找问题,经历了反复的验证我们最终发现,原来是单面布局设计的电源纹波控制不好,影响到了芯片性能,导致低温情况下有点灯信号异常。


那一年大家的考评都不好,我第一次那么强烈地感到挫败。冬天的南京很冷,是冰到骨头里的那种冷,一个人漂泊在陌生的城市,没有亲人,工作又遇到了瓶颈,心里面更添了一丝寒意。我落寞地走在南研园区里,就在这时候接到了家人的电话,父母也希望我回家发展。想想这个时候的南方家乡,应该是很温暖的吧。也就是在那一瞬间,我萌发了离开的念头。


很快我拿到了一个不错的offer,离家近,薪水也不错,说也奇怪,真正有了可以走的筹码时,我却犹豫了。接下来的一个月,我一边继续改动和优化纹波问题,一边在犹豫到底要不要离开,我的内心其实很纠结。直到伍老大来找我,他问到:“你甘心吗? ”这句话直击心坎,对啊,“做一块真正属于自己的板子”,这个目标我还没实现。我内心是不服气的,我还想再试试。于是我暗下决心:再给自己一年的时间,在华为做一块自己的单板!


2011年3月,我如愿从维护转到开发,那一年,我终于做出了自己的第一块板子。这是第一块真正意义上从头到尾由我自己拉起来的板子,一版成功,这也是同一批里唯一一个没有改版的板子。项目成功交付时,我长舒了一口气,此刻的我得到了团队的认可,也爱上了南京这个城市,千帆过尽始展颜,这也许就是对那一刻坚持的最好回报。

 

我与师父

带领团队,打造第一个百万级板子

2014年,我成为PL,上岗没多久,我和团队接到任务,要开发一个全新的系列化单板。这一系列的盒子后续目标将是每年百万级的发货量,为此成本竞争力也成为了我们的首要挑战目标。我心里多少有点忐忑,面对全新的系列化芯片应用和新方案,我们每一步都走得小心翼翼,从TR1到TR4A的四个多月时间里,我们克服了一个又一个难题,然而就在即将TR5的时候,一个疑难问题出现了。


我们的设备需要进行长期的高温高湿环境的测试,在温度循环测试时出现了降温过程的概率性零星丢包。丢包的概率并不大,十几台设备放进去,会有那么一两台出问题。但麻烦在于问题复现的没有规律,非常难定位。时间紧迫,这个问题能否解决,直接决定着我们的产品能否按时上市。


我们迅速成立了攻关小组,白天一有空大家就聚在一起讨论各种方案,晚上开温箱做测试。那时的许多场景都让我印象深刻:付世勇在凌晨开温箱换设备时的背影,芯片专家连续通宵抓波形的紧张气氛,老吴协调全领域专家一起上阵CCB的大场面,直至今日都历历在目。


由于每一次测试都需要先把设备放到高温高湿的环境48个小时,之后再观察12个小时。这样一来,完成一次测试和验证就需要整整3天的时间,验证周期很长,但留给我们的时间却并不多。大家心里干着急,却没有任何可以加速验证进程的办法。就这样反反复复,没日没夜地验证了一个月的时间,还是毫无头绪。无力感一点点浸入每个人的情绪当中,当时的版本经理李闯立刻下了决定,“我们不能再这么拖着了,联系厂家。”


我们邀请了TI公司以色列、美国的专家,公司内部的专家来南京一起攻关,大家的士气也一下子被点燃了,我们开始从芯片、时钟、到工艺和器件方面入手,一项项来排查,又折腾了一个多月的时间,丢包问题依然不规律的出现,原因还是没找到。眼看着之前被鼓舞起来的士气渐渐熄灭,我内心焦急,第一次当PL带版本,就遇到这样棘手的问题,我该怎么办?


这个时候PM李闯的坚韧和LM老吴的支持成了大家成败的关键,时值五一,我们决定让攻关组休整两天,回来再战。假期结束后,每个人似乎都“焕然一新”,在分析了前期的大量实验结果数据的基础上,终于把问题锁定在了新引进的时钟器件上。在总结了大量的参数对比测试后,我们终于找到了问题的根因,原来是因为高温高湿环境导致电容漏电电流特性发生了变化,进而影响到了时钟环路参数,时钟的的瞬间变化导致丢包现象的发生。基于此我们拿出了解决方案。当最后一轮测试顺利通过后,大家终于可以好好睡一觉了,这也再一次坚定了我的信念:无论多难的问题,在兄弟们共同的努力下都能解决。


项目最终成功交付,系列化单板同上一代相比,成本降低了40%,相比友商也构筑了20%的成本竞争优势,整体成本的降低和性能的上升让产品快速上量,这块板子的交付为后续整个新一代百万级系列化设备的海量交付奠定了坚实的基础。

 

我的团队

十年单板生涯,坚持和团队最重要

回过头来看,我们遇到的很多问题都是在于基础能力储备不够,比如前面提到的丢包问题,正是由于我们对一些基础材料的性质了解不够,不知道材料在不同环境下会有什么样的变化,这样的变化对时钟参数会有什么影响,就导致我们只能靠着直觉来测试和寻找问题根源,很难有头绪。但也正是因为我们多少次失败也没有放弃,一直在坚持,最终得到了幸运之神的眷顾,有幸一起见证产品的成功。我觉得,作为一个技术人员,永远都要把自我能力的修炼放在首位,做有方向性的持续努力,不满于现状,持续追求和坚持。


这样的想法其实得益于我竞聘PL的经历,那也是一个偶然的机会,听说盒子组的PL岗位要竞聘,做了多年的MDE,我觉得可以去尝试一下PL的工作。竞聘过程我已有些模糊,但PDU部长的问题我记得很清楚:“你和硬测吵过架吗?”我有些懵,想了想说:“前面小版本交付同硬测就技术问题有过争论,那算吵架吗?”他笑了,缓缓开口:“做PL和做MDE 不一样了,以前做MDE,你只要想着把盒子的架构搞出来,掌握降成本的技术点,加强和周边领域的交流,扩展自己的眼界就好了,你要关注的是自己的职业道路。但做PL之后,你要关注的更多,你要关注的是团队力量的整合和资源的获取,但是记住,永远都不要放弃技术,不要放松业务……”最终,凭借多年在硬件领域的积累,我成功当选,而“不要放弃技术,不要放松业务”这句话也指引着我走到今天。


我还有一个感悟就是团队的力量。我在盒子交换机这个领域坚持了10年,这是我所热爱和熟悉的领域,10年间我们产品发货累计从百万上升到千万级别,攻克了一个又一个难题。如果说我这几年在单板领域取得了一点成绩的话,很大一部分原因是有兄弟们的支持,有各周边领域的协同努力。有句话说的好,“一个人走可能可以走的快,但一群人走才能走的远”。是大家和我一起坚持,是群体智慧的碰撞让我们的产品能越做越好,大家的硬件之路也能越走越远。 
 

前路漫漫,继续求索

这些年我一直在做硬件开发和降成本工作,我觉得成本竞争力是一个产品的重要竞争力,但绝不是唯一的部分。成本竞争力带来的优势基本上只能保持一两年,如果没有技术断裂点,产品很快就能被竞争者赶超,而寻找技术断裂点就需要不断的突破创新。去年开始,我扩展了自己的工作范围和视野,参与前端设计和需求分析,去一线和客户聊他们的诉求,也参与到后端的制造,学习兄弟产品和友商产品的优势,转化并提升我们自己的能力。


回顾十年的经历,在单板硬件的道路上始终有一帮好兄弟一起前行,一路走来,有成功也有失败,经历了困难和波折,也经历了成功和喜悦。未来已来,是时候让自己更开放一些,视野更开阔一些,我将在单板这条路上继续前行。


本文为《华为人》版权所有,未经允许不得转载。如需转载请联系编辑部hwrb@huawei.com


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。