GaussDB升级失败

举报
GaussDB 数据库 发表于 2025/12/09 14:29:06 2025/12/09
【摘要】 故障现象在下发升级命令后,升级任务返回失败,或者内核升级日志报错,或者升级任务卡死不结束。故障原因可能原因有以下:升级om_agent失败。升级任务流失败。数据库内核升级失败。处理方法步骤 1     排查确认对业务是否有影响。查询状态是否正常,是否出现磁盘满、网络不通等问题,若存在,根据CN故障处理,DN故障处理解决故障。步骤 2     如果升级om_agent失败。1. 根据变更记录或...
  • 故障现象

在下发升级命令后,升级任务返回失败,或者内核升级日志报错,或者升级任务卡死不结束。

  • 故障原因

可能原因有以下:

  1. 升级om_agent失败。
  2. 升级任务流失败。
  3. 数据库内核升级失败。
  • 处理方法

步骤 1     排查确认对业务是否有影响。

查询状态是否正常,是否出现磁盘满、网络不通等问题,若存在,根据CN故障处理,DN故障处理解决故障。

步骤 2     如果升级om_agent失败。

1. 根据变更记录或者告警信息,找到升级失败的实例,在DBS运维管理平台,找到升级任务流,若失败的任务流为GaussDBV5UpgradeOmAgent则说明升级om_agent失败。

1521.png

2. 排查当前实例磁盘是否出现系统盘或数据盘满等问题,解决后重试任务流。

3. 查看任务流树表具体报错信息。

如果在WaitUpgradeOmAgentTask子任务之前失败,需要查看实例管理节点日志进行分析。

如果在WaitUpgradeOmAgentTask子任务失败,则需要登录到失败节点,确认om_agent进程是否存在。

ps ux | grep om_agent|grep -v grep

若不存在,说明进程没有正常拉起,此时需要联系华为技术支持,进一步分析om_agent进程未拉起原因。

步骤 3     升级任务流失败。

查看升级任务流,若失败的任务流为GaussDBV5UpgradeDatabase,点击树表进一步查看,若发现失败在UpgradeJob节点的WaitUpgradeResultTask子任务之前,可先重试任务流,若重试之后问题未解决,则表明任务流存在问题,需要联系华为技术支持进一步分析。

153.png

步骤 4     升级数据库内核失败。

1.  查看升级任务流,若失败的任务流为GaussDBV5UpgradeDatabase,点击树表进一步查看,若发现失败的为UpgradeJob节点的WaitUpgradeResultTask子任务,则是内核升级失败。

2.  从失败任务流中找到下发节点,登录该节点,进入到日志目录,然后查看gs_upgradectl-YYYY-MM-DD_HHmmss.log日志。

cd $GAUSSLOG/om

grep "ERROR" gs_upgradectl-YYYY-MM-DD_HHmmss.log

3.  若发现有与本次升级相近时间点的报错信息,则获取报错信息,联系华为技术支持。

----结束

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。