【DWS跨region容灾】启动容灾主备集群互信异常
1、问题现象
创建容灾后任务后,容灾启动失败。查看dwscontroller日志disaster_recovery.log发现有scp失败的错误。检查主备集群中节点/home/Ruby/.ssh/passphrase.file中的私钥和authorized_keys中的公钥,发现不一致。
2、定位步骤及解决方案
步骤1 主集群显示容灾异常,登录实例节点,vi log/disaster_recovery.log查看容灾异常时间的报错信息。
步骤2 主、备集群分别查看/home/Ruby/.ssh/下passphrase.file、authorized_keys信息。检查是否一致。
步骤3 发现公钥、私钥信息不一致。将主集群公钥信息更新到备集群所有节点的/home/Ruby/.ssh/authorized_keys文件中。获取主集群passphrase.file文件中的私钥信息,在沙箱外su – Ruby 进入/bin目录下使用 AKSK_Crypt.jar工具进行解密,得到密文。
步骤4 将主集群私钥明文在备集群每个节点使用AKSK_Crypt.jar工具进行加密,更新到对应节点的passphrase.file文件中。
步骤5 将主集群/home/Ruby/.ssh/下的id_rsa id_rsa.pub同时更新到备集群所有节点。
步骤6 以上步骤备集群每个节点沙箱内外都需要更新。
步骤7 每个节点更新好后,执行ps -ef | grep ssh-agent,kill掉ssh-agent进程。
步骤8 等待ssh-agent拉起后,ssh 测试互信是否正常。
- 点赞
- 收藏
- 关注作者
评论(0)