MRS集群切换VPC后集群状态异常不可用

举报
云技术搬运工 发表于 2021/10/26 10:52:11 2021/10/26
【摘要】 MRS310版本集群,在ecs侧将所有节点的vpc切换后集群状态异常,该篇文章对该问题进行详细分析。

【问题现象】:

MRS310版本集群,在ecs侧将所有节点的vpc切换后集群状态异常

1.png

所有服务不可用,其中Hive beeline报错如下:

2.png

【问题分析】:

MRS不支持切换vpc,切换vpc后,节点的内网ip变化,但是配置文件里面和数据库里面的ip还是原来的,导致集群通信等功能异常,集群状态也会异常,所以要恢复集群,就需要将节点切回到原来的VPC且ip和hosts文件中的ip主机映射一一对应。

【解决方案】:

1.登录master1节点,ifconfig可以看到切换vpc之后ip是192.x.x.x,

cat /etc/hosts文件,里面记录的ip是切换vpc之前的10.x.x.x。

3.png

MRS控制台节点管理里面,节点的ip是从数据库查询出来的也是10.x.x.x。

4.png

2.在MRS集群概览页面确认集群的vpc名称

5.png

3.在ecs控制台,通过mrs集群id搜索集群的所有节点,参考图示步骤,切换节点vpc,每个节点都需要操作

6.png

4.切换vpc时,虚拟私有云,子网,安全组需要和集群初始的配置一致(可在mrs集群概览页面进行查看),私有IP地址选择现在创建,填写为集群中/etc/hosts文件中对应节点的ip,如下图:

7.png

5.切换成功后需要在节点的弹性网卡中重启一下“源/目的检查”按钮。

8.png

6.待节点vpc全部切换成功后,发现manager页面无法访问,公网ip地址也无法ping通,是因为切换vpc后集群的浮动ip被强制解绑,所以公网ip和浮动ip不指向任何ecs,需要在vpc控制台将虚拟ip重新绑定到集群的两个master节点上,步骤如下:

① 确认mrs集群浮动ip

mrs manager概览页面,点击前往manager右边的切换访问Manager方式的图标

9.png

选择专线访问,即可查看集群浮动ip

10.png

② 在vpc控制台,搜索mrs集群的子网,点击子网名称即可进入详情页面,然后点击IP地址管理,如下图,确认mrs集群浮动ip绑定的实例为空

11.png

③ 点击绑定实例,分别选择两个master节点,绑定成功后如下图:

12.png

13.png

7.等待集群恢复即可。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。