FusionCare收集集群信息失败场景分析
FusionCare 8.0.8 提供了收集集群信息的功能。这里提供一些收集失败后的排查方法及常见场景。
收集失败后,首先排查日志,看是否为已知场景。
收集信息的进程日志:/opt/SysChecker/Output/SysCheckerRestLog.txt
FusionCare后台进程日志:/home/omm/FusionCare/tomcat/hct-*.log
下面是常见的一些收集失败的场景:
1、FusionInsight Manager 上 ,集群名称带 '_', 收集失败。
现象:查看/home/omm/FusionCare/tomcat/hct-*.log日志中,有报错信息:get nodeInfo Fail. by the officeName:test.(实际集群名字,应该为test_xxxx_xxx)
根因:FusionCare在页面上会传递给后台officeName字段,officeName会被前台根据'_'截取。再与后台的数据库中environment字段进行判断,两者不相等,则不会输出集群信息。
规避方法:在浏览器中按F12;临时更改红框中js脚本,改为具体的集群名称;ctrl + s ; 点击下载集群信息。(此处一定不能F5或刷新页面
2、由于集群安装时,多次重装,导致集群ID不为1,收集失败。
现象:查看/opt/SysChecker/Output/SysCheckerRestLog.txt, 明显的python错误:do get fails. Exception:xxxx. KeyError: 'name'.
问题根因:多次重装后,集群ID不为1。 而FusionCare使用1去调用接口,此时接口访问结果为空,python获取结果中的key报错。
规避方法:
- 根据FIM首页-> 集群> 集群属性> 集群ID。获取到集群ID。
- 卸载Syschecker命令: sh /opt/SysChecker/setup -u ;
- 解压syschecker 命令: cd /opt/; unzip DWS_SysChecker_8.0.8.zip;
- 修改脚本中的ID,将 2 改为具体的集群ID : vi /opt/SysChecker/SysCheck/Lib/base_process.py;
- 重装syschecker:sh /opt/SysChecker/setup -i
- 点赞
- 收藏
- 关注作者
评论(0)