[HCS]DWS集群下发失败:失败任务RdsCreateInstanceTask,错误码BMS.0042

举报
农夫山泉 发表于 2025/06/21 16:22:37 2025/06/21
【摘要】 【HCS】数仓DWS因为节点为非可部署状态导致集群下发失败问题定位过程

1、集群下发失败,对应页面错误码为BMS.0042,通过cdk任务管理页面或rms数据查看失败任务名称为RdsCreateInstanceTask,登录rms数据查看方法见第一章节:https://bbs.huaweicloud.com/blogs/427974

21.1.JPG

2、查看报错日志:从途中或rms数据获取失败任务jobid和执行下发任务的controller容器名称,然后登录对应的controller容器后,查看失败日志,操作方法见第二章节:https://bbs.huaweicloud.com/blogs/427974

21.2.JPG

3、根据业务报错日志,发现调用iaas接口时返回错误,并且明确提示了节点的状态错:

      由于DWS页面删除集群后,iaas需要格式化集群,导致集群可部署状态有延迟,因此需要在计算资源这边查看节点状态为可部署,再创建集群

21.3.JPG

4、等节点状态为可部署状态后,重新下发集群成功,如果还失败,可使用相同的方法把iaas返回的错误日志或BMS错误码给裸金属人员查看协助定位

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。