DWS集群创建业务及集群创建失败案例整理
梳理出集群创建实现流程和每个环节步骤的作用,以及其对应关键操作。再结合在交付,客户使用dws创建集群过程中大概的进度和已发现的问题案例,整理出对应关系表,帮助用户,服务人员,交付人员在处理问题时,能快速的定界,定位,解决集群创建失败问题。
首先登陆后台的mysql数据库 rms库,查看执行到哪一步:
1 登陆dwscontroller 后台rms数据库:
https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=173822
2 执行sql:
select task.job_id,
task.task_name,
task.begin_time,
task.listener_num,
task.retry_num,
task.execution_status
from rds_instance ins left join
taskmgr_task task
on ins.jobId=task.job_id
left JOIN
taskmgr_job job on
task.job_id=job.job_id
where ins.`name` like '%集群名称%'
order by task.job_id,task.begin_time;
3 根据2获取的jobid在dwscontroller服务中查看对应日志及错误日志
登录dwscontroller服务:https://bbs.huaweicloud.com/forum/thread-170316-1-1.html
grep {jobid} ossres-dws.log | grep ERROR
注:部分环节还没有案例,待继续完善
步骤 | 任务 | 作用 | 关键操作 | 大概进度 | 对应案例 |
1 | ResTenantTask | 判断表rds_restenant中是否有租户,没有则创建入库 | 5% | https://bbs.huaweicloud.com/forum/thread-94914-1-1.html | |
2 | ResUserTask | 创建运维账号,创建obs账号 | |||
3 | RdsBindEpsTask | 集群注册到eps | |||
4 | RdsCreateResourceTenantVpcTask | 创建VPC | 13% | https://bbs.huaweicloud.com/forum/thread-107164-1-1.html | |
5 | RdsSecurityGroupTask | 创建安全组 | |||
6 | RdsServerGroupTask | 创建用户组 | |||
7 | RdsCreateInstanceTask | 创建实例,ECS创建磁盘,安装操作系统;BMS则下发逻辑安装 | 33% | https://bbs.huaweicloud.com/forum/thread-107352-1-1.html https://bbs.huaweicloud.com/forum/thread-107166-1-1.html https://bbs.huaweicloud.com/forum/thread-91555-1-1.html |
|
8 | RdsPingInstanceManagerIpTask | curl manage:12017 查看管理面和节点是否想通 | curl manage:12017 | 40% | |
9 | RdsShutdownServerTask | 关闭服务器 | |||
10 | RdsCreatePortTask | 创建端口 | https://bbs.huaweicloud.com/forum/thread-153161-1-1.html | ||
11 | StartupServerTask | 启动服务器 | |||
12 | RdsDownloadPackageTask | 下载安装包 | 46% | https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=165795 | |
13 | RdsInitInstanceChannelTask | 修改root,mark,mike密码并加密入库 | |||
14 | RdsWaitSendInitConfigTask | 往当前的节点上传initDB.json文件 | |||
15 | RdsInitInstanceTask | 创建数据库用户名,完成数据库,操作系统,agent配置文件的初始化 | 节点间互信 | 64% | https://bbs.huaweicloud.com/forum/thread-112311-1-1.html https://bbs.huaweicloud.com/forum/thread-93210-1-1.html https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=158691 https://bbs.huaweicloud.com/forum/thread-93210-1-1.html https://bbs.huaweicloud.com/forum/thread-0231108635235576013-1-1.html |
16 | CreateVpcEndpointServiceTask | 如需要则创建vpcEP并置位,将状态入库到cluster表 | |||
17 | CreatePublicIPTask | 为bms或者ecs绑定eip,eip绑定方法为null则不创建 | |||
18 | BindPublicIPTask | 如果eip没有创建失败且需要绑定eip则才traffic接口绑定eip | 90% | ||
19 | RdsInstanceCreateCompletedTask | 实例创建完毕开启对实例的监控 | 9x% | https://bbs.huaweicloud.com/forum/thread-112367-1-1.html | |
20 | RdsInstanceSreMonitorTask | 根据配置及库中存的sre_monitor信息开始,sre监控器 | |||
21 | RdsCheckClusterStatusTask | 稽核集群的状态,是否所有节点都创建完成 | |||
22 | RdsClusterBackupTask | 对新建的集群进行备份 | |||
23 | CreatePrivateZoneTask | 创建内网域名 | |||
24 | RdsActiveClusterTask | 刷新集群状态 | https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=168394 | ||
25 | RdsNotifyToBssForExcuteTask | NotifyToBss |
- 点赞
- 收藏
- 关注作者
评论(0)