[HCS]DWS下发集群失败:管控面与内大网IP不通 DWS.6016
【摘要】 [HCS]DWS因管控面与内大网ip不通导致集群失败下发失败问题定位过程
1、创建集群失败,页面错误码 DWS.6016
2、登录rms数据库查看失败task名称、jobid、执行任务的controller容器,操作方法见第一章节:https://bbs.huaweicloud.com/blogs/427974
失败任务:RdsPingInstanceManagerIpTask
jobid: xxxA
controller容器名称:xxx-controller-xx
3、登录rms数据库查看rds_instance表获取manageip,登录数据库方法见第一章节:https://bbs.huaweicloud.com/blogs/427974
查询manageIP的sql:select name,manageIp from rds_instance where name like '%页面创建失败集群名称%'
ps:下发三个节点应该是三个ip,如果多次创建且使用相同的集群名字会出现多个记录,可增加字段判断,比如时间
4、登录DWS管控面管理节点EICommon-region-masterXX任一节点,然后使用curl命令测试上面获取的manageIp网络是否通,如果不通则按情况处理:
cur -kv https://manageIp:12017
(1) IBMC是否可以登录裸机,如果裸机不可登录需要联系iaas或OS人员处理,也可先查看版本是否与机器硬件(raid卡、网卡等)兼容
(2) IBMC可以登录裸机,则查看bond0是否有绑定ip,如果无绑定ip则需要解决该网络问题(有DWS裸机错误配置到gaussdb网关案例)
(3) 如果上述两个都没问题,则是网络配置有问题,联系网络人员检查交换机的配置
5、网络修复好后重新测试网络是否通畅,正常如下图,无问题后重新下发集群即可
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
作者其他文章
评论(0)