HiveServer启动成功,但页面显示状态故障
【摘要】 适用版本6.5.x。问题现象重启HiveServer成功,但是HiveServer一直处于故障状态。原因分析查看HiveServer运行日志,发现HiveServer能够正常启动,但启动后,未出现异常,又收到停止的命令导致实例停止。2019-05-13 16:17:11,993 | INFO | Thread-11 | Shutting down HiveServer2 | org.apa...
适用版本
6.5.x。
问题现象
重启HiveServer成功,但是HiveServer一直处于故障状态。
原因分析
- 查看HiveServer运行日志,发现HiveServer能够正常启动,但启动后,未出现异常,又收到停止的命令导致实例停止。
2019-05-13 16:17:11,993 | INFO | Thread-11 | Shutting down HiveServer2 | org.apache.hive.service.server.HiveServer2.stop(HiveServer2.java:550) 2019-05-13 16:17:11,994 | INFO | Thread-11 | Thrift server has stopped | org.apache.hive.service.cli.thrift.ThriftCLIService.stop(ThriftCLIService.java:292) 2019-05-13 16:17:11,994 | INFO | Thread-11 | Service:ThriftBinaryCLIService is stopped. | org.apache.hive.service.AbstractService.stop(AbstractService.java:125) 2019-05-13 16:17:11,994 | INFO | Thread-11 | Service:OperationManager is stopped. | org.apache.hive.service.AbstractService.stop(AbstractService.java:125) 2019-05-13 16:17:11,995 | INFO | Thread-11 | Service:SessionManager is stopped. | org.apache.hive.service.AbstractService.stop(AbstractService.java:125) 2019-05-13 16:17:11,997 | INFO | Thread-6 | SHUTDOWN_MSG: /************************************************************ SHUTDOWN_MSG: Shutting down HiveServer2 at hd-mgt01/192.8.154.120 ************************************************************/ | org.apache.hive.common.util.HiveStringUtils$1.run(HiveStringUtils.java:763)
- 查看nodeagent日志,发现健康检查为通过,导致nodeagent强制杀死HiveServer实例。
2019-05-13 04:07:32,284 INFO [HealthMonitorThread1_13_HiveServer] Stop process:1_13_HiveServer,result:ScriptExecutionResult [exitCode=0, output=Stopping Hive Thrift Server in Daemon Mode INFO: Stop HiveServer in type: NORMAL. , errMsg=/opt/huawei/Bigdata/FusionInsight_HD_V100R002C80SPC202/install/FusionInsight-Hive-1.3.0/hive-1.3.0/bin/ext/hivestop.sh: line 94: log/var/log/Bigdata/hive/hiveserver/stopDetail.log: No such file or directory /opt/huawei/Bigdata/FusionInsight_HD_V100R002C80SPC202/install/FusionInsight-Hive-1.3.0/hive-1.3.0/bin/ext/hivestop.sh: line 94: log/var/log/Bigdata/hive/hiveserver/stopDetail.log: No such file or directory /opt/huawei/Bigdata/FusionInsight_HD_V100R002C80SPC202/install/FusionInsight-Hive-1.3.0/hive-1.3.0/bin/ext/hivestop.sh: line 94: log/var/log/Bigdata/hive/hiveserver/stopDetail.log: No such file or directory ] com.huawei.bigdata.om.agent.process.ProcessInstance.stop(ProcessInstance.java:384)
- nodeagent通过JMX的方式检查实例(ip为本机ip:127.0.0.1),ps查看HiveServer的健康检查端口(21050)正常绑定在localhost的主机上。
- 查看/etc/hosts的配置,localhost的ip映射不为127.0.0.1,导致无法连接。
解决方案
- 备份/etc/hosts文件。
- 修改/etc/hosts中localhost与127.0.0.1的正确映射,建议拷贝正常节点的配置到异常节点。
- 如果是OMS节点需要重启OMS,其余节点需要重启Nodeagent。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)