zabbix监控进阶:如何分时段设置不同告警阈值(多阈值告警)

举报
乐维社区 发表于 2024/06/28 14:16:02 2024/06/28
【摘要】 作者 乐维社区(forum.lwops.cn)乐乐在生产环境中,企业的业务系统状态并不是一成不变的。在业务高峰时段,如节假日、促销活动或特定时间段,系统负载和用户访问量会大幅增加,此时可能需要设置更高的告警阈值来适应更高的负载,反之,低谷期则要将告警阈值调低。实践中,针对不同的业务状态调高或调低告警阈值,可以对zabbix配置多个触发器,设定在不同的时间段生效来实现。本文将以配置两个时段为例...

作者 乐维社区(forum.lwops.cn)乐乐

在生产环境中,企业的业务系统状态并不是一成不变的。在业务高峰时段,如节假日、促销活动或特定时间段,系统负载和用户访问量会大幅增加,此时可能需要设置更高的告警阈值来适应更高的负载反之,低谷期则要将告警阈值调低。

实践中,针对不同的业务状态调高或调低告警阈值,可以对zabbix配置多个触发器,设定在不同的时间段生效来实现。本文将以配置两个时段为例,讲解如何分时段设置不同告警阈值。

1. 创建触发器

2. 触发器配置

2.1. 配置第一个触发器

假定0-8点为企业业务低谷,期间业务系统CPU使用率一般不超过75%,可以将触发器配置为:当CPU使用率超过75%时即触发告警。

表达式:

now()>=000000 and now()<=080000 and last(/itops-server/system.cpu.util[Usage])>75

表达式含义:

now()>=000000 #当前时间大于0点时触发(时间格式为HHMMSS)

now()<=080000 #当前时间小于8点时触发(时间格式为HHMMSS)

last(/itops-server/system.cpu.util[Usage])>75 #主机CPU使用率指标最新取值大于75时触发

注:表达式用and将各个函数串联,所有条件满足时触发器才会触发告警

 

2.1. 配置第二个触发器

假定8-24点为企业业务高峰,期间业务系统CPU使用率可能接近或短暂超过90%,可以将触发器配置为:当CPU使用率超过90%时触发告警。该触发器与第一个类似,只需修改时段、触发阈值。

表达式:

time()>080000 and time()<=235959 and last(/itops-server/system.cpu.util[Usage])>90


当完成以上配置后,主机CPU使用率在0-8点期间大于75%时告警,在8-24点期间大于90%时告警,至此完成分时段不同告警阈值的设置。

以上就是本期的全部内容。更多zabbix等开源监控工具使用技巧欢迎关注乐维社区,更多运维问题也欢迎留言提问。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。