【DWS】集群监控信息(DMS),页面无数据显示。
- 故障现象
集群监控信息,页面无数据显示。
- 优先级
低
- 故障影响
无法显示监控数据。
- 可能原因
controller的配置*.apigateway 未配置,导致新下发的集群缺少InitDms.json
老版本升级时,checklist中不部署dms-agent或者注册apigateway失败都会导致页面无数据
- 预计处理时长
2h
- 处理思路
- 老版本升级时,checklist中不部署dms-agent或者注册apigateway失败都会导致页面无数据排查
1. 确认是否安装dms-agent
登陆数据节点沙箱内,查看进程(agent_service)是否存在,不存在则说明dms-agent未配置
修复方案:升级到8.0.3之后的管控面后,重新下发集群;升级到2021年330之后的版本,service-om页面,安装dms插件
2. 排查apigateway是否注册失败
联系APIGATEWAY维护人员或参考此链接排查(http://3ms.huawei.com/km/blogs/details/8124635)
- controller的配置*.apigateway 未配置,导致新下发的集群缺少InitDms.json
-
- 登陆数据节点沙箱内查看/home/Ruby/InitDms.json是否存在,不存在则进入下面步骤:
方法一:登陆cloudscop 页面,修改变更管理>升级> controller的配置(配置格式:https://dws.dms****.com)。
方法二:手动在各个节点创建Init.json 创建InitDms.json(新创建集群的话,还会出现此问题。)
2. 配置完json后,/home/Ruby下面DMS-AGETN日志,发现post请求结果是502。
问题原因:regionLB 上lvs的端口未配置31422和31421
规避方法:
虚拟机上面查看regionLB-01、regionLB-02的/etc/keepalived/keepalived.conf缺少31422、31421
复制31416端口好的配置,改为31422并写入到/etc/keepalived/keepalived.conf
复制31416端口好的配置,改为31423并写入到/etc/keepalived/keepalived.conf
service keepalived restart
再次确认 ipvsadm -ln | grep 31422
- 恢复确认
登录DWS查看集群监控信息,页面显示正常。
想了解GuassDB(DWS)更多信息,欢迎微信搜索“GaussDB DWS”关注微信公众号,和您分享最新最全的PB级数仓黑科技,后台还可获取众多学习资料~
- 点赞
- 收藏
- 关注作者
评论(0)