GaussDB DN组件状态Normal-告警原因分析

举报
GaussDB 数据库 发表于 2025/12/09 14:56:12 2025/12/09
【摘要】 故障现象查询集群状态,DN组件状态为Normal,历史产生DN服务异常告警。故障原因可能原因有以下:虚拟机重启产生DN服务异常告警。DN进程重启产生DN服务异常告警。主动重启DN产生DN服务异常告警。处理方法步骤 1     登录告警的DN节点,切换至Ruby用户,查询集群状态。su - Rubycm_ctl query -Cvd如上图,集群状态Normal,DN组件状态Normal。步骤 ...
  • 故障现象

查询集群状态,DN组件状态为Normal,历史产生DN服务异常告警。

  • 故障原因

可能原因有以下:

  1. 虚拟机重启产生DN服务异常告警。
  2. DN进程重启产生DN服务异常告警。
  3. 主动重启DN产生DN服务异常告警。
  • 处理方法

步骤 1     登录告警的DN节点,切换至Ruby用户,查询集群状态。

su - Ruby

cm_ctl query -Cvd

61.png

如上图,集群状态NormalDN组件状态Normal

步骤 2     当前节点,执行以下命令,查看操作系统是否发生过重启。

who -b

62.png

如上图表示操作系统于2022-10-20 16:47发生过重启。

如发生过操作系统重启,说明DN告警是由于操作系统重启导致,确认非人为重启后,联系华为技术支持排查操作系统重启原因。

若未重启继续步骤3

步骤 3     当前节点执行以下命令查看DN进程启动时间,确认告警时段内DN是否重启。

如果没有重启,则联系华为技术支持进一步定位。

若发生过重启,确认告警时间段非人为主动重启,则继续步骤4

ps ux|grep 'gaussdb --datanode' | grep -v grep

63.png

如上图,DN进程的启动时间为22:19

步骤 4     进入当前节点的日志路径,查看是否有ffic_gaussdb-*.log日志文件生成。

如告警时间点有ffic_gaussdb-*.log日志,说明DN进程发生异常重启。

打开ffic日志文件,查看ffic_gaussdb-*.log中记录的时间是否与进程重启时间对应,若时间一致,则获取ffic_gaussdb-*.log文件,联系华为技术支持。

若时间不一致或者没有此日志,则继续步骤5

ll $GAUSSLOG/ffic_log

vim ffic_gaussdb-1669904333.log

date -d @1669904333

64.png

如上图,22:18产生了ffic_gaussdb-1669904333.log日志。

642.png

643.png

上图表明,ffic_gaussdb-1669904333.log中的时间与进程重启时间一致。

步骤 5     当前节点查看cm_agent日志,打开对应时间点的cm_agent-***.log日志。

如对应时间点的日志已被压缩,则查看对应的cm_agent-****.log.gz日志。

cd $GAUSSLOG/cm/cm_agent

vim cm_agent-*.log

步骤 6     cm_agent日志中搜索如下关键字restart msg from cm_server

如告警时间点存在此日志信息,则说明是由cm_server发送重启命令给cm_agent重启DN,详细原因,可继续在此条日志继续向上查看。

若不存在,继续步骤7

66.png

步骤 7     当前节点查询获取CMS主节点,并登录到CMS主节点,查看cm_server日志。

su - Ruby

cm_ctl query -Cvd

67.png

如上图,ecs-gaussdb-0003CMS主节点。

cd $GAUSSLOG/cm/cm_server

步骤 8     查看cm_server日志,打开对应时间点的cm_server-***.log日志。

如对应时间点的日志已被压缩,则查看对应的cm_server-****.log.gz日志。

cd $GAUSSLOG/cm/cm_server

vim cm_server-*.log

步骤 9     cm_server日志中搜索关键词send restart message

如果存在,则说明是由cm_server主动重启DN

若不存在,则联系华为技术支持。

69.png

步骤 10     若以上均不涉及,联系华为技术支持。

----结束

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。