FusionCare收集集群信息失败场景分析
【摘要】 FusionCare 8.0.8 提供了收集集群信息的功能。这里提供一些收集失败后的排查方法及常见场景。收集失败后,首先排查日志,看是否为已知场景。 收集信息的进程日志:/opt/SysChecker/Output/SysCheckerRestLog.txt FusionCare后台进程日志:/home/omm/FusionCare/tomcat/hct-...
FusionCare 8.0.8 提供了收集集群信息的功能。这里提供一些收集失败后的排查方法及常见场景。
收集失败后,首先排查日志,看是否为已知场景。
收集信息的进程日志:/opt/SysChecker/Output/SysCheckerRestLog.txt
FusionCare后台进程日志:/home/omm/FusionCare/tomcat/hct-*.log
下面是常见的一些收集失败的场景:
1、FusionInsight Manager 上 ,集群名称带 '_', 收集失败。
现象:查看/home/omm/FusionCare/tomcat/hct-*.log日志中,有报错信息:get nodeInfo Fail. by the officeName:test.(实际集群名字,应该为test_xxxx_xxx)
根因:FusionCare在页面上会传递给后台officeName字段,officeName会被前台根据'_'截取。再与后台的数据库中environment字段进行判断,两者不相等,则不会输出集群信息。
规避方法:在浏览器中按F12;临时更改红框中js脚本,改为具体的集群名称;ctrl + s ; 点击下载集群信息。(此处一定不能F5或刷新页面
2、由于集群安装时,多次重装,导致集群ID不为1,收集失败。
现象:查看/opt/SysChecker/Output/SysCheckerRestLog.txt, 明显的python错误:do get fails. Exception:xxxx. KeyError: 'name'.
问题根因:多次重装后,集群ID不为1。 而FusionCare使用1去调用接口,此时接口访问结果为空,python获取结果中的key报错。
规避方法:
- 根据FIM首页-> 集群> 集群属性> 集群ID。获取到集群ID。
- 卸载Syschecker命令: sh /opt/SysChecker/setup -u ;
- 解压syschecker 命令: cd /opt/; unzip DWS_SysChecker_8.0.8.zip;
- 修改脚本中的ID,将 2 改为具体的集群ID : vi /opt/SysChecker/SysCheck/Lib/base_process.py;
- 重装syschecker:sh /opt/SysChecker/setup -i
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)