【云小课】应用平台第34课 如何配置Kafka监控?
在配置DMS for Kafka监控的过程中经常会遇到以下的问题:
从哪些纬度去监控Kafka?
怎么做才能让Kafka持续、有效的提供服务?
Kafka出问题后,如何第一时间收到告警短信/邮件?
......
啊啊啊...这些问题太让人抓狂了......
别担心,本期云小课带您学习配置DMS for Kafka告警通知的方法。
监控指标
DMS for Kafka主要从4个维度监控服务的运行情况,分别为:实例、节点、队列和消费组。
下表介绍DMS for Kafka中必须配置的监控指标,在实际业务中,建议按照以下告警策略,配置监控指标的告警规则。如果想了解所有的监控指标,请戳这里
指标名称 |
正常范围 |
告警策略 |
指标说明和告警处理建议 |
磁盘容量使用率 |
0~100 |
告警阈值:原始值>85 连续触发次数:3 告警级别:紧急 |
指标说明:该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。单位:%。 处理建议:出现该告警时,需要修改实例存储空间。具体操作,请参考变更实例规格。 |
CPU核均负载 |
0~2 |
告警阈值:原始值>1.5 连续触发次数:3 告警级别:重要 |
指标说明:该指标为从Kafka节点虚拟机层面采集的CPU每个核的平均负载。 处理建议:出现该告警时,需要修改实例基准带宽/代理个数,即扩节点。具体操作,请参考变更实例规格。 |
内存使用率 |
0~100 |
告警阈值:原始值>85 连续触发次数:3 告警级别:紧急 |
指标说明:该指标为Kafka节点虚拟机层面采集的内存使用率。单位:%。 处理建议:出现该告警时,需要修改实例基准带宽/代理个数,即扩节点。具体操作,请参考变更实例规格。 |
Kafka进程JVM堆内存使用率 |
0~100 |
告警阈值:原始值>85 连续触发次数:3 告警级别:紧急 |
指标说明:该指标从Kafka节点Kafka进程JVM中采集的堆内存使用率。单位:%。 处理建议:出现该告警时,需要修改实例基准带宽/代理个数,即扩节点。具体操作,请参考变更实例规格。 |
配置告警通知
消费组可消费消息数是判断消息是否堆积的重要指标,下面以配置消费组可消费消息数的告警通知为例,向您介绍配置Kafka监控的方法。
请参考配置消费组可消费消息数告警通知的方法,配置DMS for Kafka其他监控指标的告警通知。
前提条件
在配置消费组可消费消息数告警通知前,确保已购买Kafka实例、创建Topic,并且已成功消费消息。
配置消费组可消费消息数的告警通知
-
登录DMS for Kafka控制台,在需要创建告警通知的实例所在行,单击,进入云监控服务页面。
-
在“消费组”页签,设置需要创建告警通知的消费组。
图1 选择需要创建告警通知的消费组-
消费组:选择需要创建告警通知的消费组。
-
队列:选择“全部队列”。
-
-
选中“消费组可消费消息数”图表,单击,创建告警规则。
图1 消费组可消费消息数图表 -
在“创建告警规则”界面,设置告警名称。
图1 设置告警名称-
名称:您自定义的告警名称,用于识别不同的告警。
-
描述:告警规则描述,可以不填。
-
企业项目:告警规则所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该告警规则。
-
-
在“创建告警规则”界面,设置告警策略。
图1 设置告警策略-
选择类型:选择“自定义创建”。
-
告警策略:触发告警规则的告警策略,是否触发告警取决于连续周期的数据是否达到阈值。
-
告警级别:根据实际情况选择告警等级。
-
-
在“创建告警规则”界面,设置告警通知对象。
图1 设置告警通知对象 -
单击“立即创建”,完成告警规则的设置。
告警规则创建完成后,在云监控服务的“告警 > 告警规则”界面,查看新创建的告警规则。
图1 查看新创建的告警规则
以上,是本次云小课为您带来的全部内容,想了解更多DMS for Kafka相关内容,请戳这里。
- 点赞
- 收藏
- 关注作者
评论(0)