OES面向零售行业的落地与经验总结

举报
华为云确定性运维 发表于 2023/12/20 16:12:08 2023/12/20
【摘要】 本文总结华为云在零售行业的实践经验,通过 OES 使能服务对其运维组织、流程、平台等能力的评估和咨询规划,促进企业云端变革,助力企业数字化成功转型。OES:Operation Enabling Service 使能服务。

来源:华为云确定性运维专刊(第四期)

作者:唐余鹏

       背景

       国内的零售行业从最开始的代工到走向全方位自主从事设计、研发、制造、营销和销售,向中国消费者提供专业的产品。近些来,零售行业快速复合增长,已成为支柱行业。 随着规模的变大,管理的复杂程度呈几何增长。为确保战略目标的达成,零售行业在供应链管理、生产流程、销售管理、营销等方面需要进行优化和创新,这些优化和创新要求企业IT系统能快速的迭代进行支撑。例如,某企业预测到2030年,业务流量将增长3倍。如何在业务的快速增长中确保系统的安全稳定可靠,成为技术团队最大的挑战之一。

       对于零售行业来说,这些挑战既是困难,也是机遇。通过利用云服务,零售行业可以降低IT成本,提高高效稳定的ICT系统。通过云服务提供的大数据和人工智能,零售行业可以更好地了解消费者需求,优化产品设计,提高客户满意度。如此,如何“管好云”做好云运维服务,是数字化转型战略成功的关键环节。华为云SRE过去多年通过服务千行万业以及自身实践得到的能力,并总结出确定性运维解决方案。其中包含两大专业服务:OES使能服务和管云服务MS,能够帮助客户管云业务建立更完善的运 维体系,助力客户完成数字化转型成功。

       在此背景下,华为对零售企业提供OES使能服务,以完善优化其运维运营能力,为数字化转型奠定基础。

       业务挑战

       随着业务的发展,带来了云服务的快速发展和广泛应用。如何有效做好管云业务,对零售行业带来了一系列的挑战。其中包含安全性、可靠性、效率性等各个方面。OES服务就是围绕这这几个目标而展开的。
       OES使能规划服务的第一步就是调研。会从组织、流程、平台、工具、技术和能力等多维度对企业的运维现状进行深度解析。经过对零售行业的充分调研,我们总结出零售行业运维的挑战如下,包括但不限于:

       无有效运维机制

       » 效果方面,随着业务的快速增长,运维体量越来越大,带来的风险也越高,目前运维还处于救火模式,难以满足业务容量增长与客户体验预期。
       » 效率方面,以“找熟人”的运维方式,难以适应全球化、多品牌、多渠道新增业务场景与出海战略。

       组织职能不清晰

       » 无统一运维组织,导致运维定位模糊,职责归属、技能要求无法明确。未统一运维接口连接内外部,无满意度与投诉受理机制,促进工作改进,体系无法闭环,质量难以提升。

       流程缺失

       » 流程缺失较多,现有制度已技术操作标准为主,缺少协同型流程制度文件,未形成体系化。

       工具分散

       » 工具集成度低,分散不成体系,难以满足业务场景需求,推广应用效果不理想,开发运维一体化工具支撑仍存在断点,制约应用系统迭代效率。

       服务业务不可观测

       » 缺少服务质量衡量标准,产品与开发团队无法就系统的SLA达成一致,对各品牌无法承诺预期质量。
       » 业务可观测平台:缺少基于消费者体验相关的SLO、SLI业务健康度可视化平台,支持系统运营方案优化、运维成本制定的合理评估。故障修复能力弱
       » 监控系统零散,无法事前预警,事中小组式处理模式,影响恢复时长,过程无记录,事后趋势复盘无机制。

       服务效率低

       » 运维工作量巨增,人员有限,需要智能客服、共享知识库、运维自动化及CMDB平台的支撑进行缓解。

      标准和评估

      每项能力都有自己的成熟度,这里的综合成熟度主要将各项成熟度进行汇总,大体从组织、流程、 工具三方面进行综合评估,如下图所示:

4.PNG

      通过不同阶段的运维标准进行评估,该零售企业运维成熟度现状处于标准化运维初级阶段,进阶目标:第一阶段夯实标准化运维,未来向SRE转型进阶。

5.PNG

      方案实践

      通过OES使能服务的第一步调研活动,帮助我们深入了解客户的业务需求、运营流程、技术架构以及目标,从而进一步分析现有运维流程,识别潜在瓶颈,制定改进计划,预测和预防可能出现的问题,从而减少停机时间和维护成本。确定性运维的实现需要依靠一系列组织流程和平台改革以实现目标。

       组织结构的优化

       通过优化组织结构,使得团队更加专注于关键任务。明确的职责分工和流程规范使得运维团队更高效地协同工作,从而提高整体的业务运作效率。流程规范化提高协同性通过制定清晰的操作流程,成功提高团队成员之间的协同性。这不仅减少了沟通和执行误差,还为团队带来更加高效的工作体验。

       高效的自动化安全策略

       通过整合自动化工具,客户成功实施高效的安全策略。不仅包括对系统漏洞的快速修复,还包括实时监控和响应,确保对潜在威胁的快速反应,从而保障系统的安全性。

       安全合规的规范化流程

       通过确保每个步骤都符合安全标准和法规,建立可靠的合规性,降低面临潜在安全风险的概率,使得安全合规更加可控。

       实时威胁分析与预测

       通过实时威胁分析和预测,成功预测并防范潜在的安全威胁。这种前瞻性的安全性措施有效地保障企业关键数据和系统的安全性。

       安全性与系统稳定性的协同提升

       » 通过确保规范化的运维流程和自动化工具的使用,与安全性形成良好的协同效应,有效减少可能导致系统崩溃或安全漏洞的因素。
       » 确定性运维相对于传统运维强调更高的自动化和可预测性,通过规范化和自动化的流程来降低系统故障的概率。这种方法减少了人为错误,提高系统的稳定性和可维护性。并且对零售行业的IT运维战略目标分成三个阶段去逐步落实,在夯实现有的能力和运维体系后,逐步进行改革和转型成确定性运维的体系。

6.PNG

       结语

       以上是华为云确定性运维OES使能服务在零售行业项目中的实践,后续,我们将不断拓展应用,积累更多的行业经验和使能服务经验,并结合管云服务,帮助客户管理好云服务,以使我们的客户能够将更多精力放在自身的业务运营和拓展上。希望确定性运维服务能够帮助到千行万业,构建一个安全可信、稳定可靠、资源高效、业务敏捷的运维体系,真正做到管好云、用好云。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。