又双叒获奖了!确定性运维荣获信通院多项案例荣誉
2024年12月3日,全球数字经济大会云·AI·计算国际合作论坛在北京成功召开,会上中国信通院正式公布了第三届云系统稳定安全运行典型案例,华为云斩获多项案例荣誉,包括获得由中国信通院云计算与大数据研究所颁发的《大模型时代在运维领域应用多智能体的实践》、《华为KooDrive云空间基于AppStage构建数智化运维体系》、《华为能源Power产品依托AppStage快速构建全链路可观测体系》典型案例证书,分享优秀实践和创新成果,为数字化转型中的企业提供最佳实践参考。
会议现场
大模型时代在运维领域应用多智能体的实践
案例亮点:大模型在AIOps中带来新机遇,同时面临着海量知识快速获取、多模态数据异常检测、多源复杂数据根因定位等挑战。方案提出以LLM为中心结合多模态Agent协同的自主决策、自动修复的运维方案,基于确定性运维经验,通过知识图谱的根因定位,结合多模态数据异常检测基础模型,构建全能的运维分析与故障排除系统。方案使用多Agent协同完成运维主流程,包括异常检测、根因定位、故障分类、故障分析和修复建议。多模态异常检测基础模型具备处理Trace、Metric和Log数据的能力,可直接使用。框架与算法具有较强的泛化能力,适用于各种场景的故障快速恢复需求。故障诊断报告提供可解释的故障爆炸半径,为实际生产运维故障恢复提供依据。
华为云SRE AI使能专家张曦博士(左二)受邀主会场领奖
华为 KooDrive云空间基于AppStage构建数智化运维体系
案例亮点:随着业务的快速拓展,承载的用户规模越来越大,以及不断新增的业务需求,系统组件规模和复杂度也在不断增加,对系统的可靠性、安全性和稳定性提出了更高的要求。基于华为云AppStage一站式运维平台构建数智化运维,以应用为运维对象,从变更管理、监控管理、稳定性管理、资源管理、运维安全和运维治理等维度开展运维保障,实现该项目运维的自动化、智能化和可视化,提升运维效率。
华为云SRE专家(左五)受邀现场领奖
华为能源Power产品依托AppStage快速构建全链路可观测体系
案例亮点:应用向云原生演进后,存在多种多样的工具与技术,工具之间数据割裂无法形成全局的视野,直接影响了应用运维的效率与效果。该产品依托AppStage建立以应用视角的一体化数智运维平台,打通了业务日志、开源工具、调用链、云资源监控指标之间的数据壁垒,围绕应用纬度联动分析作为整体的全链路可观测体系的数据来源,使业务监控指标更加丰富,帮助SRE在故障发生时可通过逐层下钻快速对问题节点进行定界分析,打通数据孤岛,建立应用纬度的数据可观测体系,通过流程编排实现故障自恢复,构建在线可用度监测系统,从而确保系统的高可用性和稳定性。
华为云SRE专家(左五)受邀现场领奖
确定性运维护航千行万业开展运维变革 助力企业“确定性”
随着企业数字化转型不断深入,IT和业务的稳定性治理持续进行,确定性运维通过专家服务和配套工具平台,通过1个体系(确定性运维体系)+ 3个方案(故障快恢、可观测、混沌演练),以专家服务+工具平台,让客户实现故障快恢和故障减少,建立全链路压力测试能力,并通过混沌演练验证预案有效性和系统高可用性,应用后系统韧性显著提升,形成标准化运维体系,助力千万行业实现运维变革落地。
- 点赞
- 收藏
- 关注作者
评论(0)