DWS管控面集群状态和后台不一致(手动修改)

举报
余年 发表于 2023/08/08 16:15:39 2023/08/08
【摘要】 【问题背景】管控面集群显示待重启状态第一步:为了压测压满,管控面修改CN max_connections为100,管控面显示集群待重启,此时客户为主动重启;第二步:压测过程中,由于某些原因导致CN重启,max_connections管控面修改被动生效,且与max_wal_senders相等,导致CN重启失败挂掉;第三步:在后台将CN max_connections修改回来,并做CN实例修复,...

【问题背景】管控面集群显示待重启状态

【常见版本】HCS 8.1.3

【定位进展】

1、为了压测压满,管控面修改CN max_connections为100,管控面显示集群待重启,此时客户为主动重启;
2、压测过程中,由于某些原因导致CN重启,max_connections管控面修改被动生效,且与max_wal_senders相等,导致CN重启失败挂掉;
3、在后台将CN max_connections修改回来,并做CN实例修复,集群状态在后台成功恢复正常;
4、发现管控面任然显示待重启状态需要手动修改rms数据库记录状态信息;

【解决方案】

1、集群状态显示待重启,后台改参数重启导致,需要登录rms数据库,然后把ds_cluster表statusDetail列更新成Normal;

查询SQL为:select id,name,status,statusDetail from rds_cluster where id='集群编号';

select id,name,status,statusDetail from rds_cluster where status='200';

 修改SQL为:update rds_cluster set statusDetail='Normal' where id='集群ID';

2、集群详情面还是显示待重启,还需要改rds_configuration_relation表configurationStatus状态configurationStatus改为In-Sync;

查询SQL为:select * from rds_configuration_relation where objId='集群ID';

修改SQL为:update rds_configuration_relation set configurationStatus='In-Sync' where objId='集群ID';

3、两个表改好后用户集群状态全部显示可用;

4、其次还可以排查以下几个表:

rds_configuration_guc_record
rds_configuration_guc_history
rds_action


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。