[HCS]DWS下发集群失败:管控面与内大网IP不通 DWS.6016

举报
农夫山泉 发表于 2024/07/15 22:51:08 2024/07/15
【摘要】 [HCS]DWS因管控面与内大网ip不通导致集群失败下发失败问题定位过程

1、创建集群失败,页面错误码 DWS.6016

2、登录rms数据库查看失败task名称、jobid、执行任务的controller容器,操作方法见第一章节:https://bbs.huaweicloud.com/blogs/427974

      失败任务:RdsPingInstanceManagerIpTask

      jobid: xxxA

     controller容器名称:xxx-controller-xx

3、登录rms数据库查看rds_instance表获取manageip,登录数据库方法见第一章节:https://bbs.huaweicloud.com/blogs/427974

查询manageIP的sql:select name,manageIp from rds_instance where name like '%页面创建失败集群名称%' 

ps:下发三个节点应该是三个ip,如果多次创建且使用相同的集群名字会出现多个记录,可增加字段判断,比如时间

4、登录DWS管控面管理节点EICommon-region-masterXX任一节点,然后使用curl命令测试上面获取的manageIp网络是否通,如果不通则按情况处理:

     cur -kv https://manageIp:12017 

    (1) IBMC是否可以登录裸机,如果裸机不可登录需要联系iaas或OS人员处理,也可先查看版本是否与机器硬件(raid卡、网卡等)兼容

    (2) IBMC可以登录裸机,则查看bond0是否有绑定ip,如果无绑定ip则需要解决该网络问题

    (3) 如果上述两个都没问题,则是网络配置有问题,联系网络人员检查交换机的配置


5、网络修复好后重新测试网络是否通畅,正常如下图,无问题后重新下发集群即可

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。