GaussDB数据库安装失败
- 故障现象
安装数据库集群,安装失败,上报错误信息。
- 故障原因
可能原因有以下:
- OM_Agent已安装,无法检测到相关进程。
- OM_Agent启动失败。
- 安装用户无crontab权限。
- 安装用户无文件目录权限。
- 处理方法
步骤 1 执行如下命令查看om_agent日志,确认失败原因。
vim /home/Ruby/log/om_agent/agent.log
常见原因如下:
Failed to do decompress package Adaptor path is xxx:预安装解包失败,请执行步骤2处理。
available_zone is incorrect:安装包部署方式与配置部署方式不一致,请执行步骤3处理。
no route to host:防火墙或网络问题,请执行步骤4处理。
The ssl_server_crt_files does not exist:SSL证书问题,
其他原因,请联系华为技术支持。
检查om_agent安装路径下,默认为/dbs/om-agent/agent_xxx/common/public_cloud.conf中,adaptorDir配置项是否为正确adaptor路径。
检查om_agent安装路径下,默认为/dbs/om-agent/agent_xxx/common/public_cloud.conf中,pkgDir路径是否存在,且集群用户拥有权限可以进入。
检查json中配置的包路径以及包名是否正确。
查看安装包的压缩是否符合规范。使用tar --no-same-owner --strip-components 1 -xf“安装包”,应在当前目录生成GaussDB-Kernel_503.1.XXX_***_***_Distributed.tar.gz和GaussDB-Kernel_xxx_Om_xxx.tar.gz的压缩包。
检查安装包部署方式与安装配置文件中部署方式是否一致:若一致,请执行#ZH-CN_TOPIC_0000001731205721/zh-cn_topic_0000001511677428_li1820100121114。若不一致,请修改后重新安装。
若此前安装过数据库,可能为环境变量问题导致,清除/home/Ruby/.bashrc,/home/Ruby/gauss_env_file中的GPHOME环境变量,并重新安装。
步骤 4 (可选)根据日志判断启动ETCD遇到的问题,进行相应处理。
若日志报错存在no route to host,则为网络通讯异常,可能为防火墙配置问题导致。使用iptables -L 和 systemctl status firewalld.service 命令查看防火墙状态,并检查配置,或关闭防火墙,完成后重新安装。
若日志报错存在context deadline exceeded,则可能为节点间时间不一致,导致ETCD安全认证失效无法连接,可以使用gs_ssh -c date命令查看集群各个节点的时间是否一致。若一致,请执行#ZH-CN_TOPIC_0000001731205721/zh-cn_topic_0000001511677428_li1352912137141。若不一致,请修改一致后重新安装。
若出现其余状况,请联系华为技术支持。
步骤 5 (可选)在安装OM_Agent时,om_agent.conf配置文件中存在agent_ssl配置项,该项为agent_ssl证书存放路径,若该路径下无相关证书,则会导致ssl认证异常,无法安装。在相关路径下增添ssl文件,具体操作参考《安装指南》中“安装前准备 > 生成集群安装所需要的证书”章节进行操作。
----结束
- 点赞
- 收藏
- 关注作者
评论(0)