操作系统库版本问题导致数据库集群安装OMS失败问题的分析与修复
【摘要】 一、问题描述 安装6.5.1版本的GaussDB集群时,在安装OMS的步骤遇到 step7:configuring and starting agent [fail] 报错出现在“安装双机manager”阶段,使用的安装包信息如下 使用环境是centOS 7.4 二、问题分析1. 当前安装oms失败的问题原因是由于oms节点ldap启...
一、问题描述
安装6.5.1版本的GaussDB集群时,在安装OMS的步骤遇到 step7:configuring and starting agent [fail]
报错出现在“安装双机manager”阶段,使用的安装包信息如下
使用环境是centOS 7.4
二、问题分析
1. 当前安装oms失败的问题原因是由于oms节点ldap启动失败导致,具体表现为ldap启动后,使用客户端命令ldapsearch无法查询出结果,报如下错误:
ldap_sasl_bind(SIMPLE): Can't contact LDAP server (-1)
打开ldap 服务端调试日志,发现是TLS握手失败:
对比当前问题环境,与其他正常安装的环境,发现当前失败系统升级过openssl。因此,首先尝试回退了openssl版本,回退之后,安装仍然失败,报错和调试日志信息与之前一样;因此,还需要进一步分析
2. ldapserach查询失败时,通过tcpdump抓包,发现有TLSv1.2的错误信息
3. 继续分析,发现正常的环境ldapserach查询ldap服务,查询结果如下
而在当前失败的节点上,查询ldap服务监听的浮动ip,报错如下,确定了浮动ip没有问题
4.下面分析与TLS加密通信相关的系统库,比对两个环境系统库差异如下:
发现是当前nss、libcurl相关的库版本为3.44,正常环境为3.36,不兼容所致。
三、问题解决
1. 对对应的nss、libcurl库进行降版本处理
yum downgrade curl-7.29.0-42.el7 libcurl-7.29.0-42.el7 nss-3.36.0-7.el7_5 nss-pem-1.0.3-4.el7 nss-softokn-3.36.0-5.el7_5 nss-softokn-freebl-3.36.0-5.el7_5 nss-sysinit-3.36.0-7.el7_5 nss-tools-3.36.0-7.el7_5 nss-util-3.36.0-1.1.el7_6
2. 重新进行“安装双机Manager”步骤,重试成功
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)