操作系统库版本问题导致数据库集群安装OMS失败问题的分析与修复

举报
世纪末的魔术师 发表于 2020/06/22 11:21:13 2020/06/22
【摘要】 一、问题描述 安装6.5.1版本的GaussDB集群时,在安装OMS的步骤遇到 step7:configuring and starting agent [fail] 报错出现在“安装双机manager”阶段,使用的安装包信息如下 使用环境是centOS 7.4 二、问题分析1. 当前安装oms失败的问题原因是由于oms节点ldap启...

一、问题描述

       安装6.5.1版本的GaussDB集群时,在安装OMS的步骤遇到 step7:configuring and starting agent [fail]

      image.png

     报错出现在“安装双机manager”阶段,使用的安装包信息如下

     image.png

     使用环境是centOS 7.4

     image.png


二、问题分析


1. 当前安装oms失败的问题原因是由于oms节点ldap启动失败导致,具体表现为ldap启动后,使用客户端命令ldapsearch无法查询出结果,报如下错误:

ldap_sasl_bind(SIMPLE): Can't contact LDAP server (-1)

打开ldap 服务端调试日志,发现是TLS握手失败:

image.png

 对比当前问题环境,与其他正常安装的环境,发现当前失败系统升级过openssl。因此,首先尝试回退了openssl版本,回退之后,安装仍然失败,报错和调试日志信息与之前一样;因此,还需要进一步分析


2. ldapserach查询失败时,通过tcpdump抓包,发现有TLSv1.2的错误信息

image.png


3. 继续分析,发现正常的环境ldapserach查询ldap服务,查询结果如下

image.png

而在当前失败的节点上,查询ldap服务监听的浮动ip,报错如下,确定了浮动ip没有问题

image.png


4.下面分析与TLS加密通信相关的系统库,比对两个环境系统库差异如下:

image.png

发现是当前nss、libcurl相关的库版本为3.44,正常环境为3.36,不兼容所致。

 


三、问题解决

1. 对对应的nss、libcurl库进行降版本处理   

yum downgrade curl-7.29.0-42.el7 libcurl-7.29.0-42.el7 nss-3.36.0-7.el7_5 nss-pem-1.0.3-4.el7 nss-softokn-3.36.0-5.el7_5 nss-softokn-freebl-3.36.0-5.el7_5 nss-sysinit-3.36.0-7.el7_5 nss-tools-3.36.0-7.el7_5 nss-util-3.36.0-1.1.el7_6


2. 重新进行“安装双机Manager”步骤,重试成功

image.png

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。