【最佳实践】事件监控最佳实践

举报
云上精选 发表于 2020/04/23 19:00:21 2020/04/23
【摘要】 可通过事件监控,对异常事件告警进行处理,保证业务稳定运行

弹性云服务器是作为一种可随时获取、弹性可扩展的计算服务器。在各业务中,弹性云服务器作核心基础,细微的性能变化,运行异常及自动恢复,都可能会引起云服务上的业务受到大幅震荡。

因此需使用弹性负载均衡将访问流量根据转发策略分发到后端多台弹性云服务器,通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。

表1 ECS重点事件

事件名称

事件说明

处理步骤

开始自动恢复

弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,该过程会导致云服务器重启,并发送一个“开始自动恢复”的事件,当迁移完成后,并发送一个“结束自动恢复”的事件,表示已恢复正常。

当收到“开始自动恢复”时,说明已发生故障,该机器无法使用,需要考虑更换弹性云服务器,或考虑将流量导至其他机器。

结束自动恢复

当收到“结束自动恢复”时,说明该ECS已正常工作,可继续使用。

操作步骤

  1. 登录管理控制台。
  2. 在管理控制台左上角单击图标,选择区域和项目。
  3. 单击“管理与部署 > 云监控”。
  4. 单击页面左侧的“事件监控”,在事件监控页面,单击相页面右上角的创建告警规则,根据界面提示配置参数,如图1所示。
    图1 创建告警规则

    事件名称分别配置“开始自动恢复”“结束自动恢复”,具体参数说明请参见创建告警规则

  5. 配置完成后,单击“立即创建”,完成创建告警规则。

    当ECS出现异常事件时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。