【DWS跨region容灾】启动容灾主备集群互信异常

举报
居居小太阳 发表于 2025/10/23 11:34:53 2025/10/23
【摘要】 1、问题现象      创建容灾后任务后,容灾启动失败。查看dwscontroller日志disaster_recovery.log发现有scp失败的错误。检查主备集群中节点/home/Ruby/.ssh/passphrase.file中的私钥和authorized_keys中的公钥,发现不一致。2、定位步骤及解决方案      步骤1  主集群显示容灾异常,登录实例节点,vi log/di...

1、问题现象

      创建容灾后任务后,容灾启动失败。查看dwscontroller日志disaster_recovery.log发现有scp失败的错误。检查主备集群中节点/home/Ruby/.ssh/passphrase.file中的私钥和authorized_keys中的公钥,发现不一致。

2、定位步骤及解决方案

      步骤1  主集群显示容灾异常,登录实例节点,vi log/disaster_recovery.log查看容灾异常时间的报错信息。

      步骤2   主、备集群分别查看/home/Ruby/.ssh/下passphrase.file、authorized_keys信息。检查是否一致。

      步骤3   发现公钥、私钥信息不一致。将主集群公钥信息更新到备集群所有节点的/home/Ruby/.ssh/authorized_keys文件中。获取主集群passphrase.file文件中的私钥信息,在沙箱外su – Ruby 进入/bin目录下使用 AKSK_Crypt.jar工具进行解密,得到密文。

      步骤4    将主集群私钥明文在备集群每个节点使用AKSK_Crypt.jar工具进行加密,更新到对应节点的passphrase.file文件中。

      步骤5    将主集群/home/Ruby/.ssh/下的id_rsa id_rsa.pub同时更新到备集群所有节点。

      步骤6    以上步骤备集群每个节点沙箱内外都需要更新。

      步骤7    每个节点更新好后,执行ps -ef | grep ssh-agent,kill掉ssh-agent进程。

      步骤8    等待ssh-agent拉起后,ssh 测试互信是否正常。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。