FusionCare收集集群信息失败场景分析

举报
耕心 发表于 2023/04/19 10:36:20 2023/04/19
5.8k+ 0 0
【摘要】 FusionCare 8.0.8 提供了收集集群信息的功能。这里提供一些收集失败后的排查方法及常见场景。收集失败后,首先排查日志,看是否为已知场景。          收集信息的进程日志:/opt/SysChecker/Output/SysCheckerRestLog.txt          FusionCare后台进程日志:/home/omm/FusionCare/tomcat/hct-...

FusionCare 8.0.8 提供了收集集群信息的功能。这里提供一些收集失败后的排查方法及常见场景。

收集失败后,首先排查日志,看是否为已知场景。

          收集信息的进程日志:/opt/SysChecker/Output/SysCheckerRestLog.txt

          FusionCare后台进程日志:/home/omm/FusionCare/tomcat/hct-*.log

下面是常见的一些收集失败的场景:

1、FusionInsight Manager 上 ,集群名称带 '_', 收集失败。

      现象:查看/home/omm/FusionCare/tomcat/hct-*.log日志中,有报错信息:get nodeInfo Fail. by the officeName:test.(实际集群名字,应该为test_xxxx_xxx)

      根因:FusionCare在页面上会传递给后台officeName字段,officeName会被前台根据'_'截取。再与后台的数据库中environment字段进行判断,两者不相等,则不会输出集群信息。

      规避方法:在浏览器中按F12;临时更改红框中js脚本,改为具体的集群名称;ctrl + s ; 点击下载集群信息。(此处一定不能F5或刷新页面

                        20230418-203741(WeLinkPC).png

2、由于集群安装时,多次重装,导致集群ID不为1,收集失败。

      现象:查看/opt/SysChecker/Output/SysCheckerRestLog.txt, 明显的python错误:do get fails. Exception:xxxx. KeyError: 'name'.

      问题根因:多次重装后,集群ID不为1。 而FusionCare使用1去调用接口,此时接口访问结果为空,python获取结果中的key报错。

      规避方法:

  1. 根据FIM首页-> 集群> 集群属性> 集群ID。获取到集群ID。
  2. 卸载Syschecker命令:  sh /opt/SysChecker/setup -u ;
  3. 解压syschecker 命令:   cd /opt/; unzip DWS_SysChecker_8.0.8.zip;
  4. 修改脚本中的ID,将 2 改为具体的集群ID : vi /opt/SysChecker/SysCheck/Lib/base_process.py;20230418-204808(WeLinkPC).png
  5. 重装syschecker:sh /opt/SysChecker/setup -i
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。