DWS管控面集群状态和后台不一致
【问题背景】管控面集群显示待重启状态
第一步:为了压测压满,管控面修改CN max_connections为100,管控面显示集群待重启,此时客户为主动重启;
第二步:压测过程中,由于某些原因导致CN重启,max_connections管控面修改被动生效,且与max_wal_senders相等,导致CN重启失败挂掉;
第三步:在后台将CN max_connections修改回来,并做CN实例修复,集群状态在后台成功恢复正常;
第四步:发现管控面任然显示待重启状态集群成功点击监控面板无数据;
【常见版本】HCS 8.1.3
【解决方案】
1、集群状态显示待重启,后台改参数重启导致,需要登录rms数据库,然后把statusDetail更新成Normal;
查询SQL为:select id,name,status,statusDetail from rds_cluster where id='集群编号';
select id,name,status,statusDetail from rds_cluster where status='200';
修改SQL为:update rds_cluster set statusDetail='Normal' where id='集群ID';
2、集群详情面还是显示待重启,还需要改rds_configuration_relation表configurationStatus状态为In-Sync;
查询SQL为:select * from rds_configuration_relation where objId='集群ID';
修改SQL为:update rds_configuration_relation set configurationStatus='In-Sync' where objId='集群ID';
3、两个改好后用户集群状态全部显示可用;
4、还可以排查以下几个表:
rds_configuration_guc_record
rds_configuration_guc_history
rds_action
- 点赞
- 收藏
- 关注作者
评论(0)