HiveServer启动成功,但页面显示状态故障

举报
yd_225577686 发表于 2022/12/27 11:49:54 2022/12/27
【摘要】 适用版本6.5.x。问题现象重启HiveServer成功,但是HiveServer一直处于故障状态。原因分析查看HiveServer运行日志,发现HiveServer能够正常启动,但启动后,未出现异常,又收到停止的命令导致实例停止。2019-05-13 16:17:11,993 | INFO | Thread-11 | Shutting down HiveServer2 | org.apa...

适用版本

6.5.x。

问题现象

重启HiveServer成功,但是HiveServer一直处于故障状态。

原因分析

  1. 查看HiveServer运行日志,发现HiveServer能够正常启动,但启动后,未出现异常,又收到停止的命令导致实例停止。
    2019-05-13 16:17:11,993 | INFO  | Thread-11 | Shutting down HiveServer2 | org.apache.hive.service.server.HiveServer2.stop(HiveServer2.java:550)
    2019-05-13 16:17:11,994 | INFO  | Thread-11 | Thrift server has stopped | org.apache.hive.service.cli.thrift.ThriftCLIService.stop(ThriftCLIService.java:292)
    2019-05-13 16:17:11,994 | INFO  | Thread-11 | Service:ThriftBinaryCLIService is stopped. | org.apache.hive.service.AbstractService.stop(AbstractService.java:125)
    2019-05-13 16:17:11,994 | INFO  | Thread-11 | Service:OperationManager is stopped. | org.apache.hive.service.AbstractService.stop(AbstractService.java:125)
    2019-05-13 16:17:11,995 | INFO  | Thread-11 | Service:SessionManager is stopped. | org.apache.hive.service.AbstractService.stop(AbstractService.java:125)
    2019-05-13 16:17:11,997 | INFO  | Thread-6 | SHUTDOWN_MSG: 
    /************************************************************
    SHUTDOWN_MSG: Shutting down HiveServer2 at hd-mgt01/192.8.154.120
    ************************************************************/ | org.apache.hive.common.util.HiveStringUtils$1.run(HiveStringUtils.java:763)
  2. 查看nodeagent日志,发现健康检查为通过,导致nodeagent强制杀死HiveServer实例。
    2019-05-13 04:07:32,284 INFO  [HealthMonitorThread1_13_HiveServer] Stop process:1_13_HiveServer,result:ScriptExecutionResult [exitCode=0, output=Stopping Hive Thrift Server in Daemon Mode
    INFO: Stop HiveServer in type: NORMAL.
    , errMsg=/opt/huawei/Bigdata/FusionInsight_HD_V100R002C80SPC202/install/FusionInsight-Hive-1.3.0/hive-1.3.0/bin/ext/hivestop.sh: line 94: log/var/log/Bigdata/hive/hiveserver/stopDetail.log: No such file or directory
    /opt/huawei/Bigdata/FusionInsight_HD_V100R002C80SPC202/install/FusionInsight-Hive-1.3.0/hive-1.3.0/bin/ext/hivestop.sh: line 94: log/var/log/Bigdata/hive/hiveserver/stopDetail.log: No such file or directory
    /opt/huawei/Bigdata/FusionInsight_HD_V100R002C80SPC202/install/FusionInsight-Hive-1.3.0/hive-1.3.0/bin/ext/hivestop.sh: line 94: log/var/log/Bigdata/hive/hiveserver/stopDetail.log: No such file or directory
    ] com.huawei.bigdata.om.agent.process.ProcessInstance.stop(ProcessInstance.java:384)
  3. nodeagent通过JMX的方式检查实例(ip为本机ip:127.0.0.1),ps查看HiveServer的健康检查端口(21050)正常绑定在localhost的主机上。
  4. 查看/etc/hosts的配置,localhost的ip映射不为127.0.0.1,导致无法连接。

解决方案

  1. 备份/etc/hosts文件。
  2. 修改/etc/hosts中localhost与127.0.0.1的正确映射,建议拷贝正常节点的配置到异常节点。
  3. 如果是OMS节点需要重启OMS,其余节点需要重启Nodeagent。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。