GaussDB(DWS)混合云第三方介质备份失败排查定界步骤

举报
上官寒雨 发表于 2025/07/06 17:13:01 2025/07/06
【摘要】 背景说明:针对NBU、鼎甲、爱数等第三方介质备份失败排查定界(非侵入式场景),本案例以nbu为例步骤1:明确首次失败节点:登录备份下发节点查看备份日志(日志路径与有第三方介质发起备份时指定):步骤2:明确首次失败日志:登录步骤1查到节点查看roach agent日志如下由于roach_client返回异常断连:步骤3:确认对应roach_client节点ip信息:在对应agent日志中搜索‘...

背景说明:针对NBU、鼎甲、爱数等第三方介质备份失败排查定界(非侵入式部署场景),本案例以nbu备份失败为例

原理说明:

混合云第三方介质备份标准使用非侵入式架构部署如下:

1)在每个NBU media服务器上部署一个插件roach_client

2)每个集群节点上的Roach agent进程负责将数据发送到NBU media服务器上的roach_client插件;

3)roach_client调用NBU客户端提供的XBSA系列API接口,发送数据给NBU media服务器下挂的磁带机或磁盘。

定位或定界此场景备份失败问题整体思路需要先明确首次备份失败是由于roach_client调用xbsa接口导致备份失败,还是roach agent内部异常导致整体失败。

若按照以下步骤明显第一次报错由于roach_client调用xbsa接口失败则需要第三方备份介质深入分析异常根因。

定位/定界步骤:

步骤1:明确首次失败节点:登录备份下发节点查看备份日志(日志路径由第三方介质发起备份时指定):

步骤2:明确首次失败日志:登录步骤1查到节点查看roach agent日志如下由于roach_client返回异常断连:

步骤3:确认对应roach_client节点ip信息:在对应agent日志中搜索‘Sucess to connected Remote Media Server’

步骤4:根据步骤3确认IP信息登录对应节点查看roach_client日志:由于nbu检测异常报错后退出

步骤5:根据以上步骤能够确认最开始异常点由于NBU存储介质访问接口出现异常引起整个备份失败,后续分析步骤由NBU或者对应第三方介质分析。


【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。