GaussDB (DWS) 集群管理系列:DN/GTM failover告警

举报
CloudGanker 发表于 2021/11/25 16:38:41 2021/11/25
【摘要】 DN/GTM failover告警

DN/GTM failover告警

告警汇总

CM告警汇总链接

告警编号

DN failover

  • 十进制编号:1078919202
  • 十六进制编号:0x404F0022

GTM failover

  • 十进制编号:1078919204
  • 十六进制编号:0x404F0024

告警信息

DN failover

  • 中文名称:Datanode失效切换

  • 英文名称:DatanodeFailOver

    代码中告警英文名称为ALM_AI_DatanodeFailOver

  • 英文附加信息:Datanode standby %s fail over

  • 中文附加信息:数据实例%s失效切换

GTM failover

  • 中文名称:GTM失效切换

  • 英文名称:GTMFailOver

    代码中告警英文名称为ALM_AI_GTMFailOver

  • 英文附加信息:GTM standby %s fail over

  • 中文附加信息:GTM实例%s失效切换

告警类型

  • ALM_AT_Event
  • 事件级告警每次触发时仅上报一次

告警等级

  • DWS: 未适配

告警规则

核心规则

  • 当cm_agent收到DN或GTM的failover消息时,产生此告警。

补充规则

  • 当集群重启时,cm_server可能下发failover命令,此时也将触发告警。

相关告警

  • 当主DN或主GTM出现异常时,由cm_server仲裁并下发DN/GTM的failover命令。此时往往出现DN或GTM的实例异常告警,也可能出现实例重启、链接数据库服务失败等告警。
    • 1078919170 AbnormalGTMInst
    • 1078919172 AbnormalDatanodeInst
    • 1078919246 AbnormalInsRestart
    • 1078919243 AbnormalCmaConnFail
    • 1078919242 AbnormalPhonyDead

版本分析

  • 内核版本
id name C80 651 8.0 8.1
1078919202 DatanodeFailOver ✔️ ✔️ ✔️ ✔️
1078919204 GTMFailOver ✔️ ✔️ ✔️ ✔️
  • FIM支持情况待补充。
  • DWS未适配。

测试验证

杀死主DN进程,该DN重启后会通过failover命令升主,cm_agent日志如下:

CmsMsgProcess LOG: Received failover msg from cm_server, including instance id 6001 and data path /home/1p1s1d/data/dnP1.
Alarm LOG: Reporting alarm id 1078919202 with type 4 and info "Datanode standby dn_6001 fail over".

告警日志信息如下:

alarm 1078919202 4 0009000000000009001200070059mpp1p1s1d127.0.0.1ecs-env-3108dn_6001Datanode#standby#dn_6001#fail#over#数据实例dn_6001失效切换

停止主GTM进程,备GTM上的cm_agent日志如下:

CmsMsgProcess LOG: Received failover msg from cm_server, including instance id 1001 and data path /home/1p1s1d/data/gtm.
Alarm LOG: Reporting alarm id 1078919204 with type 4 and info "GTM standby gtm_1001 fail over".

告警日志信息如下:

alarm 1078919204 4 0009000000000009001200080055mpp1p1s1d127.0.0.1ecs-env-3108gtm_1001GTM#standby#gtm_1001#fail#over#GTM实例gtm_1001失效切换

GaussDB(DWS)博文后缀.png

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。