DWS集群创建业务及集群创建失败案例整理

举报
金哲 发表于 2021/03/10 01:52:29 2021/03/10
【摘要】 整理集群创建实现流程和每个环节步骤的作用,以及其对应关键操作。再结合在交付,客户使用dws创建集群过程中大概的进度和已发现的问题案例,整理出对应关系表,帮助用户,服务人员,交付人员在处理问题时,能快速的定界,定位,解决集群创建失败问题。

       梳理出集群创建实现流程和每个环节步骤的作用,以及其对应关键操作。再结合在交付,客户使用dws创建集群过程中大概的进度和已发现的问题案例,整理出对应关系表,帮助用户,服务人员,交付人员在处理问题时,能快速的定界,定位,解决集群创建失败问题。

首先登陆后台的mysql数据库 rms库,查看执行到哪一步:

1 登陆dwscontroller 后台rms数据库:

https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=173822

2 执行sql:

select task.job_id,
task.task_name,
task.begin_time,
task.listener_num,
task.retry_num,
task.execution_status
from rds_instance ins left join 
taskmgr_task task
on ins.jobId=task.job_id
left JOIN
taskmgr_job  job on 
task.job_id=job.job_id
where ins.`name` like '%集群名称%'
order by task.job_id,task.begin_time;

3 根据2获取的jobid在dwscontroller服务中查看对应日志及错误日志

登录dwscontroller服务:https://bbs.huaweicloud.com/forum/thread-170316-1-1.html

grep {jobid} ossres-dws.log | grep ERROR

     注:部分环节还没有案例,待继续完善

步骤 任务 作用 关键操作 大概进度 对应案例
1 ResTenantTask 判断表rds_restenant中是否有租户,没有则创建入库   5% https://bbs.huaweicloud.com/forum/thread-94914-1-1.html
2 ResUserTask 创建运维账号,创建obs账号      
3 RdsBindEpsTask 集群注册到eps      
4 RdsCreateResourceTenantVpcTask 创建VPC   13% https://bbs.huaweicloud.com/forum/thread-107164-1-1.html
5 RdsSecurityGroupTask 创建安全组      
6 RdsServerGroupTask 创建用户组      
7 RdsCreateInstanceTask 创建实例,ECS创建磁盘,安装操作系统;BMS则下发逻辑安装   33% https://bbs.huaweicloud.com/forum/thread-107352-1-1.html
https://bbs.huaweicloud.com/forum/thread-107166-1-1.html
https://bbs.huaweicloud.com/forum/thread-91555-1-1.html
8 RdsPingInstanceManagerIpTask curl manage:12017 查看管理面和节点是否想通 curl manage:12017 40%

https://bbs.huaweicloud.com/forum/thread-91484-1-1.html

9 RdsShutdownServerTask 关闭服务器      
10 RdsCreatePortTask 创建端口     https://bbs.huaweicloud.com/forum/thread-153161-1-1.html
11 StartupServerTask 启动服务器      
12 RdsDownloadPackageTask 下载安装包   46%  https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=165795
13 RdsInitInstanceChannelTask 修改root,mark,mike密码并加密入库      
14 RdsWaitSendInitConfigTask 往当前的节点上传initDB.json文件    
15 RdsInitInstanceTask 创建数据库用户名,完成数据库,操作系统,agent配置文件的初始化 节点间互信 64%

https://bbs.huaweicloud.com/forum/thread-112311-1-1.html

https://bbs.huaweicloud.com/forum/thread-93210-1-1.html

https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=158691

https://bbs.huaweicloud.com/forum/thread-93210-1-1.html

https://bbs.huaweicloud.com/forum/thread-0231108635235576013-1-1.html

16 CreateVpcEndpointServiceTask 如需要则创建vpcEP并置位,将状态入库到cluster表      
17 CreatePublicIPTask 为bms或者ecs绑定eip,eip绑定方法为null则不创建      
18 BindPublicIPTask 如果eip没有创建失败且需要绑定eip则才traffic接口绑定eip   90%  
19 RdsInstanceCreateCompletedTask 实例创建完毕开启对实例的监控   9x% https://bbs.huaweicloud.com/forum/thread-112367-1-1.html
20 RdsInstanceSreMonitorTask 根据配置及库中存的sre_monitor信息开始,sre监控器  
 
           
21 RdsCheckClusterStatusTask 稽核集群的状态,是否所有节点都创建完成      
22 RdsClusterBackupTask 对新建的集群进行备份      
23 CreatePrivateZoneTask 创建内网域名      
24 RdsActiveClusterTask 刷新集群状态     https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=168394
25 RdsNotifyToBssForExcuteTask NotifyToBss      

GaussDB(DWS)博文后缀.png

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。