GaussDB (DWS) 告警相关问题排查
【摘要】 告警相关问题排查
告警相关问题排查
【snas_cm_cmd命令阻塞】
在所有节点沙箱内做如下检查。在所有节点沙箱内做如下检查。在所有节点沙箱内做如下检查。
-
获取
snas_cm_cmd
路径:- 执行
cm_ctl query -Cvd | head
获取cm_server
数据目录,如下图所示
- 执行
-
将路径最后的
cm_server
替换成cm_agent
并进入此目录,执行grep -r "alarm_component" cm.conf
获取snas_cm_cmd
的路径,如下图所示
-
确认告警设置超时时间:
- 打开与
snas_cm_cmd
同一目录下的mon_client_alarm.py
文件,查看sendMsg
函数,如果是下面的情况
- 则在
HTTPConnection
的传入参数中增加超时时间,即修改为
- 打开与
-
检查后台是否有长时间执行的
snas_cm_cmd
进程,即执行ps ux | grep -v grep | grep snas_cm_cmd
,如果输出结果中有已运行较长时间的,则将相应进程kill -9
杀死。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)