操作系统库版本问题导致数据库集群安装OMS失败问题的分析与修复

举报
世纪末的魔术师 发表于 2020/06/22 11:21:13 2020/06/22
9.8k+ 0 0
【摘要】 一、问题描述 安装6.5.1版本的GaussDB集群时,在安装OMS的步骤遇到 step7:configuring and starting agent [fail] 报错出现在“安装双机manager”阶段,使用的安装包信息如下 使用环境是centOS 7.4 二、问题分析1. 当前安装oms失败的问题原因是由于oms节点ldap启...

一、问题描述

       安装6.5.1版本的GaussDB集群时,在安装OMS的步骤遇到 step7:configuring and starting agent [fail]

      image.png

     报错出现在“安装双机manager”阶段,使用的安装包信息如下

     image.png

     使用环境是centOS 7.4

     image.png

二、问题分析

1. 当前安装oms失败的问题原因是由于oms节点ldap启动失败导致,具体表现为ldap启动后,使用客户端命令ldapsearch无法查询出结果,报如下错误:

ldap_sasl_bind(SIMPLE): Can't contact LDAP server (-1)

打开ldap 服务端调试日志,发现是TLS握手失败:

image.png

 对比当前问题环境,与其他正常安装的环境,发现当前失败系统升级过openssl。因此,首先尝试回退了openssl版本,回退之后,安装仍然失败,报错和调试日志信息与之前一样;因此,还需要进一步分析


2. ldapserach查询失败时,通过tcpdump抓包,发现有TLSv1.2的错误信息

image.png


3. 继续分析,发现正常的环境ldapserach查询ldap服务,查询结果如下

image.png

而在当前失败的节点上,查询ldap服务监听的浮动ip,报错如下,确定了浮动ip没有问题

image.png


4.下面分析与TLS加密通信相关的系统库,比对两个环境系统库差异如下:

image.png

发现是当前nss、libcurl相关的库版本为3.44,正常环境为3.36,不兼容所致。

三、问题解决

1. 对对应的nss、libcurl库进行降版本处理   

yum downgrade curl-7.29.0-42.el7 libcurl-7.29.0-42.el7 nss-3.36.0-7.el7_5 nss-pem-1.0.3-4.el7 nss-softokn-3.36.0-5.el7_5 nss-softokn-freebl-3.36.0-5.el7_5 nss-sysinit-3.36.0-7.el7_5 nss-tools-3.36.0-7.el7_5 nss-util-3.36.0-1.1.el7_6

2. 重新进行“安装双机Manager”步骤,重试成功

image.png

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。