[HCS]DWS集群下发失败:失败任务RdsCreateInstanceTask,错误码BMS.0042
【摘要】 【HCS】数仓DWS因为节点为非可部署状态导致集群下发失败问题定位过程
1、集群下发失败,对应页面错误码为BMS.0042,通过cdk任务管理页面或rms数据查看失败任务名称为RdsCreateInstanceTask,登录rms数据查看方法见第一章节:https://bbs.huaweicloud.com/blogs/427974
2、查看报错日志:从途中或rms数据获取失败任务jobid和执行下发任务的controller容器名称,然后登录对应的controller容器后,查看失败日志,操作方法见第二章节:https://bbs.huaweicloud.com/blogs/427974
3、根据业务报错日志,发现调用iaas接口时返回错误,并且明确提示了节点的状态错:
由于DWS页面删除集群后,iaas需要格式化集群,导致集群可部署状态有延迟,因此需要在计算资源这边查看节点状态为可部署,再创建集群
4、等节点状态为可部署状态后,重新下发集群成功,如果还失败,可使用相同的方法把iaas返回的错误日志或BMS错误码给裸金属人员查看协助定位
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)