GaussDB CN故障-状态Deleted

举报
GaussDB 数据库 发表于 2025/12/09 14:48:53 2025/12/09
【摘要】 故障现象查询集群状态,CN组件状态为Deleted,产生CN服务异常告警。故障原因可能原因有以下:虚拟机重启,断网等故障导致CN被剔除,产生CN服务异常告警。CN与主DN断连导致CN被剔除,产生CN服务异常告警。CN组件Down导致CN被剔除,产生CN服务异常告警。CN组件频繁重启导致CN被剔除,产生CN服务异常告警。CN组件被主动剔除,产生CN服务异常告警。处理方法步骤 1     登录故...
  • 故障现象

查询集群状态,CN组件状态为Deleted,产生CN服务异常告警。

  • 故障原因

可能原因有以下:

  1. 虚拟机重启,断网等故障导致CN被剔除,产生CN服务异常告警。
  2. CN与主DN断连导致CN被剔除,产生CN服务异常告警。
  3. CN组件Down导致CN被剔除,产生CN服务异常告警。
  4. CN组件频繁重启导致CN被剔除,产生CN服务异常告警。
  5. CN组件被主动剔除,产生CN服务异常告警。
  • 处理方法

步骤 1     登录故障的CN节点,切换至Ruby用户,查询集群状态。

su - Ruby

cm_ctl query -Cvd

31.png

如上图,集群状态为Degradedcn_5001被剔除,状态为Deleted

步骤 2     当前节点,执行以下命令,查看操作系统是否发生过重启。

who -b

32.png

如上图表示操作系统于2022-10-20 16:47发生过重启。

如发生过操作系统重启,若非人为主动重启,需联系华为技术支持排查操作系统重启原因,故障处理后执行节点修复加回被剔除的CN

继续步骤3

步骤 3     确认主机是否发生断网等。

如有断网发生,排查断网原因,故障处理后执行节点修复加回被剔除的CN,如不涉及,继续步骤4

步骤 4     登录到CMS主节点,查看cm_server日志。

可通过查询集群状态获取CMS主节点:

cm_ctl query -Cvd

34.png

如上图,ecs-gaussdb-0003CMS主节点。

执行如下命令,查看日志:

cd $GAUSSLOG/cm/cm_server

步骤 5     查看对应时间点的cm_server-***.log日志。

vim cm_server-*.log

如对应时间点的日志已被压缩,则查看对应的cm_server-****.log.gz日志。

步骤 6     cm_server日志中搜索有关键词cn_down_to_delete=1

36.png

如对应时间点存在该信息,则原因为CN组件Down 导致,参考2 CN故障-状态Down排查详细原因,确认原因及故障解决之后,执行节点修复加回被剔除的CN

如不涉及继续步骤7

步骤 7     cm_server日志中搜索有关键词:isCnDnDisconnected=1

如对应时间点存在该信息,则原因为CN组件与主DN断连导致,此时需要排查CN与主DN之间的网络,待网络恢复后,执行节点修复加回被剔除的CN

如不涉及继续步骤8

步骤 8     cm_server日志中搜索有关键词:cmd_disable_cn=1

37.png

如对应时间点存在该信息,则原因为CN组件被主动剔除,确认剔除原因后,后执行节点修复加回被剔除的CN

如不涉及继续步骤9

步骤 9     cm_server日志中搜索有关键词cn instance restarts within ten minutes is more than

39.png

如对应时间点存在此信息,则原因为CN组件频繁重启导致,出现此种情况,参考1 CN组件状态Normal-告警原因分析进一步定位,故障处理后执行节点修复加回被剔除的CN

若不存在,继续步骤10

步骤 10     若以上均不涉及,则联系华为技术支持。

----结束

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。