操作系统库版本问题导致数据库集群安装OMS失败问题的分析与修复
一、问题描述
安装6.5.1版本的GaussDB集群时,在安装OMS的步骤遇到 step7:configuring and starting agent [fail]
报错出现在“安装双机manager”阶段,使用的安装包信息如下
使用环境是centOS 7.4
二、问题分析
1. 当前安装oms失败的问题原因是由于oms节点ldap启动失败导致,具体表现为ldap启动后,使用客户端命令ldapsearch无法查询出结果,报如下错误:
ldap_sasl_bind(SIMPLE): Can't contact LDAP server (-1)
打开ldap 服务端调试日志,发现是TLS握手失败:
对比当前问题环境,与其他正常安装的环境,发现当前失败系统升级过openssl。因此,首先尝试回退了openssl版本,回退之后,安装仍然失败,报错和调试日志信息与之前一样;因此,还需要进一步分析
2. ldapserach查询失败时,通过tcpdump抓包,发现有TLSv1.2的错误信息
3. 继续分析,发现正常的环境ldapserach查询ldap服务,查询结果如下
而在当前失败的节点上,查询ldap服务监听的浮动ip,报错如下,确定了浮动ip没有问题
4.下面分析与TLS加密通信相关的系统库,比对两个环境系统库差异如下:
发现是当前nss、libcurl相关的库版本为3.44,正常环境为3.36,不兼容所致。
三、问题解决
1. 对对应的nss、libcurl库进行降版本处理
yum downgrade curl-7.29.0-42.el7 libcurl-7.29.0-42.el7 nss-3.36.0-7.el7_5 nss-pem-1.0.3-4.el7 nss-softokn-3.36.0-5.el7_5 nss-softokn-freebl-3.36.0-5.el7_5 nss-sysinit-3.36.0-7.el7_5 nss-tools-3.36.0-7.el7_5 nss-util-3.36.0-1.1.el7_6
2. 重新进行“安装双机Manager”步骤,重试成功
- 点赞
- 收藏
- 关注作者
评论(0)