DWS管控面集群状态和后台不一致(手动修改)
【问题背景】管控面集群显示待重启状态
【常见版本】HCS 8.1.3
【定位进展】
1、为了压测压满,管控面修改CN max_connections为100,管控面显示集群待重启,此时客户为主动重启;
2、压测过程中,由于某些原因导致CN重启,max_connections管控面修改被动生效,且与max_wal_senders相等,导致CN重启失败挂掉;
3、在后台将CN max_connections修改回来,并做CN实例修复,集群状态在后台成功恢复正常;
4、发现管控面任然显示待重启状态需要手动修改rms数据库记录状态信息;
【解决方案】
1、集群状态显示待重启,后台改参数重启导致,需要登录rms数据库,然后把ds_cluster表statusDetail列更新成Normal;
查询SQL为:select id,name,status,statusDetail from rds_cluster where id='集群编号';
select id,name,status,statusDetail from rds_cluster where status='200';
修改SQL为:update rds_cluster set statusDetail='Normal' where id='集群ID';
2、集群详情面还是显示待重启,还需要改rds_configuration_relation表configurationStatus状态configurationStatus改为In-Sync;
查询SQL为:select * from rds_configuration_relation where objId='集群ID';
修改SQL为:update rds_configuration_relation set configurationStatus='In-Sync' where objId='集群ID';
3、两个表改好后用户集群状态全部显示可用;
4、其次还可以排查以下几个表:
rds_configuration_guc_record
rds_configuration_guc_history
rds_action
- 点赞
- 收藏
- 关注作者
评论(0)