华为云的硬核力量-确定性运维的前世、今生和未来

举报
SRE确定性运维 发表于 2022/06/13 17:06:19 2022/06/13
【摘要】   SRE(Site Reliability Engineer,站点可用性工程师)是华为云的质量守护者,让客户因为质量选择华为云是SRE团队的使命,我们希望用确定性运维,去涵盖所有的能力以及结果,确定性是我们对客户的承诺。

作者:安宇

123456.JPG

      SRE(Site Reliability Engineer,站点可用性工程师)是华为云的质量守护者,让客户因为质量选择华为云是SRE团队的使命,我们希望用确定性运维,去涵盖所有的能力以及结果,确定性是我们对客户的承诺。

——华为云计算公司SRE部部长 安宇

      华为全球产业展望(GIV)预测,到2025年,全球企业云技术使用率将达100%,与之相对,Gartner预测企业传统数据中心将关闭90%。全面云化已不可阻挡,云正成为越来越多企业数字化转型和智能化升级的底座。随着越来越多的设备、终端和传感器联网,越来越多的应用云化和SaaS化,稳定性和可靠性已经成为每一个企业必须深度思考和保障的问题。

2-2华为云监控指挥中心.png

图:华为云监控作战指挥中心

      前世:转型、变革,SRE是质量与效率目标协同达成的组织实现
     
SRE最早由谷歌提出,是DevOps模式的一种组织实现形式,近年来已经成为国内互联网行业的标配,同时很多政企也开始尝试这种新形态的组织。为什么各行各业都在引入这种组织模式和方法论,实际上还是来源于企业发展的业务需要。
      伴随着业务快速迭代和敏态发展的要求,对传统运维提出了巨大的挑战,软件的快速上线模糊了运维和研发的边界、业务上线速度和现网稳定性之间的冲突变得很难调和,华为云把这些挑战总结为MATE,快速迭代Active Iteration、解耦网格Messy Complex、安全生产Trustworthy Operation、全栈运维Evolution FullStack。
      在这种情况下,业界迫切的需要一种运维组织、人员能力及知识体系发展的方法和指导。SRE强调了研发和运维团队的组织级协作,提出了PRR、EB等质量保障的流程机制,进而也提出了全栈工程师等组织人力要求,通过一系列的实践有效解决了这些挑战。

2-3华为云乌兰察布数据中心.png

图:华为云乌兰察布数据中心

     今生:实践、融合,确定性运维是SRE实践的华为化
      过去几年华为云取得了高速的增长,在保证华为云稳定可靠的前提下,如何支撑业务的高速发展不断提升效率,实现质量和效率的同步提升,是华为云SRE面临的巨大挑战。 
     2017年华为云开始实践SRE模式后,目前已经成为国内最大的SRE团队之一。经过多年的实践,尤其是结合华为政企运维经验之后,华为云形成了确定性运维的理念。
      我们认为稳定可靠是云的核心竞争力,SRE团队是最重要的生产力部门,SRE工程师是视野最全面的研发精英。SRE作为质量领域的守护者,其职责就是看护好整个华为云的质量。通过面向云服务全生命周期的质量看护,实现现网可预期的高可用质量结果,我们把这种运维理念以及质量管理体系称之为确定性运维。
      华为云希望达成的目标是现网质量预期确定、管理确定、实现确定,这不仅仅是华为云对自己的要求,希望我们的客户,以及客户的客户,得到确定性的服务质量、更好的服务体验,这也是我们作为一个云服务商的承诺。
2-4坐落在贵安新区数谷大道 1 号的“童话小镇”,也是华为云全球最大云数据中心.png

位于贵安云上屯的华为数据中心

      未来:开放、协作,携手迎接IT运维行业的美好未来

      IT运维行业正在面临着颠覆性的变化,我们正在从保障设备稳定的防守型运维转向支撑业务敏捷的进攻型运维,从关注自身网络转向关注客户应用,从系统维护工程师转向研发工程师,这个转型的过程对运维提出艰巨挑战的同时,也给每个组织和个人提供了难得的发展机会。

      华为云SRE过去构建了一些能力,也还在持续解决新的挑战,我们已经构建了一套质量管理机制、一套运维平台、一支全球专家队伍,更重要的是,我们已经和很多客户一起开展了面向应用视角的稳定性提升工作,助力客户提升应用稳定性,从应用层到平台底层,在成本、质量、效率中寻找最优方案。

      在这个实现确定性运维的道路上,我们得到了非常多客户、业界同仁的帮助和支持,我们也愿意将所得的知识开放出来,和业界同仁一起共同进步,全面拥抱云化的时代,重新理解和定义云化时代下的运维竞争力,携手迎接IT运维行业的美好未来。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。