FusionCare收集集群信息失败场景分析

举报
耕心 发表于 2023/04/19 10:36:20 2023/04/19
【摘要】 FusionCare 8.0.8 提供了收集集群信息的功能。这里提供一些收集失败后的排查方法及常见场景。收集失败后,首先排查日志,看是否为已知场景。          收集信息的进程日志:/opt/SysChecker/Output/SysCheckerRestLog.txt          FusionCare后台进程日志:/home/omm/FusionCare/tomcat/hct-...

FusionCare 8.0.8 提供了收集集群信息的功能。这里提供一些收集失败后的排查方法及常见场景。

收集失败后,首先排查日志,看是否为已知场景。

          收集信息的进程日志:/opt/SysChecker/Output/SysCheckerRestLog.txt

          FusionCare后台进程日志:/home/omm/FusionCare/tomcat/hct-*.log

下面是常见的一些收集失败的场景:

1、FusionInsight Manager 上 ,集群名称带 '_', 收集失败。

      现象:查看/home/omm/FusionCare/tomcat/hct-*.log日志中,有报错信息:get nodeInfo Fail. by the officeName:test.(实际集群名字,应该为test_xxxx_xxx)

      根因:FusionCare在页面上会传递给后台officeName字段,officeName会被前台根据'_'截取。再与后台的数据库中environment字段进行判断,两者不相等,则不会输出集群信息。

      规避方法:在浏览器中按F12;临时更改红框中js脚本,改为具体的集群名称;ctrl + s ; 点击下载集群信息。(此处一定不能F5或刷新页面


                        20230418-203741(WeLinkPC).png


2、由于集群安装时,多次重装,导致集群ID不为1,收集失败。

      现象:查看/opt/SysChecker/Output/SysCheckerRestLog.txt, 明显的python错误:do get fails. Exception:xxxx. KeyError: 'name'.

      问题根因:多次重装后,集群ID不为1。 而FusionCare使用1去调用接口,此时接口访问结果为空,python获取结果中的key报错。

      规避方法:

  1. 根据FIM首页-> 集群> 集群属性> 集群ID。获取到集群ID。
  2. 卸载Syschecker命令:  sh /opt/SysChecker/setup -u ;
  3. 解压syschecker 命令:   cd /opt/; unzip DWS_SysChecker_8.0.8.zip;
  4. 修改脚本中的ID,将 2 改为具体的集群ID : vi /opt/SysChecker/SysCheck/Lib/base_process.py;20230418-204808(WeLinkPC).png
  5. 重装syschecker:sh /opt/SysChecker/setup -i


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。