GaussDB恢复到当前实例失败

举报
GaussDB 数据库 发表于 2025/12/09 14:18:22 2025/12/09
【摘要】 故障现象GaussDB恢复到当前实例失败。故障原因可能原因有以下:工作流异常,提交工作流失败。备份服务异常。Agent报错。处理方法步骤 1     使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运维中心(OC)”,...
  • 故障现象

GaussDB恢复到当前实例失败。

  • 故障原因

可能原因有以下:

  1. 工作流异常,提交工作流失败。
  2. 备份服务异常。
  3. Agent报错。
  • 处理方法

步骤 1     使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运维中心(OC)”,进入ManageOne运维面。

密码方式:输入帐号和密码。

默认帐号:bss_admin

说明:

如果是升级场景,默认帐号为admin

默认密码:参见《华为云Stack 8.3.0 帐户一览表》的“A类(Portal)”页签中,“ManageOne运维面”帐户对应的默认密码。

USB Key方式:插入已预置用户证书的USB Key,选择设备和用户证书,并输入PIN

步骤 2     在“集中监控 > 告警管理 > 当前告警”中查看集中告警,并处理告警信息,获取告警中的实例IDinstance_id)或者工作ID

102.png

步骤 3     选择“实例运维 > 任务管理”,右上角筛选条件选择“实例ID”或“任务流ID”,输入框中输入获取的实例ID或工作流ID,执行搜索,查看“当前状态”为失败的任务。

1031.png

“失败原因”列输出了失败时的程序错误日志。单击“树表”,则可以查看任务失败具体的环节。

1032.png

步骤 4     根据task执行结果,在不同故障场景下执行恢复备份操作。

根据步骤3中展示的失败概览,分析失败原因。

场景一:备份文件导出失败(GaussDbv5ImportDbStatusCheckTask执行失败)。

修复方案:

重试GaussDbV5ImportDbStatusCheckTask,等待重试结果。如果仍然导出失败,请联系运维处理。

场景二:上传备份文件失败恢复后关键全备失败(RdsBackupFileTask执行失败)。

修复方案:

重试RdsBackupFileTask,等待重试结果。如果仍然备份失败,请联系运维处理。

场景三:恢复完成后释放HA锁失败(RdsInstanceHaStatusChangeGoodTask执行失败)。

修复方案:

重试RdsInstanceHaStatusChangeGoodTask,等待重试结果。如果仍然备份失败,请联系运维处理。

步骤 5     若以上步骤仍不能解决问题,收集日志和告警信息,联系技术支持进行处理。

需要下载的日志信息有:

管理侧:

DBS-GaussDB-backupmanager组件下的日志。

DBS-GaussDB-instancemanager组件下的日志。

租户侧:

agent组件下的:

/home/Ruby/log/agent.log

/home/Ruby/log/asyncJobResult.dat

/home/Ruby/log/om_agent/agent.log

GaussDB Kernel组件下的:/var/lib/log/Ruby

----结束

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。