GaussDB iptables策略限制,导致实例升级报错

举报
GaussDB 数据库 发表于 2025/12/09 09:19:17 2025/12/09
【摘要】 故障现象客户进行实例升级,任务流报错,升级失败,如下图所示。适用版本GaussDB全部版本。业务影响管控任务流报错,无影响。内核任务流报错,自动回滚成功,无业务影响,运维功能、备份可能会受影响。内核任务流报错,自动回滚失败,集群状态可能异常,影响业务。故障原因根据报错任务流时间,147秒报错,说明升级任务流可能还没有下发内核,可能在om_agent前置校验阶段报错。处理方法步骤 1     ...
  • 故障现象

客户进行实例升级,任务流报错,升级失败,如下图所示。

201.png

202.png

  • 适用版本

GaussDB全部版本。

  • 业务影响

管控任务流报错,无影响。

内核任务流报错,自动回滚成功,无业务影响,运维功能、备份可能会受影响。

内核任务流报错,自动回滚失败,集群状态可能异常,影响业务。

  • 故障原因

根据报错任务流时间,147秒报错,说明升级任务流可能还没有下发内核,可能在om_agent前置校验阶段报错。

  • 处理方法

步骤 1     根据升级报错任务流,找到命令下发节点。如下图,单击“操作 > 修改context”,找到“NODE_ID”。

211.png

212.png

步骤 2     根据NODE_ID,找到对应节点,登录到节点后台。

步骤 3     切换到Ruby用户,加载环境变量,执行如下命令,查看升级日志。

ll $GAUSSLOG/om/gs_upgradectl_2025*.log

23.png

步骤 4     发现节点上没有产生内核升级日志,说明升级动作还没有到内核侧,返回查看om_agent的日志。

步骤 5     执行如下命令,查看om_agent的升级日志。

vim /home/Ruby/log/om_agent/agent.log

步骤 6     搜索报错时间点前后有没有“ERRORfailed”等报错信息。

26.png

步骤 7     根据报错日志分析,检查数据库连接失败:Check database connection failed。根据报错日志“could not connect to server: Operation now in progress Is the server running on host "127.0.0.1" and accepting TCP/IP connections on port 8000”分析,怀疑是gsql连接数据库报错。

步骤 8     在数据库节点执行如上命令,指定-h 127.0.0.1不通,不指定可以连上,怀疑是127.0.0.1不通。

指定-h 127.0.0.1

281.png

不指定-h 127.0.0.1

282.png

步骤 9     执行如下命令,测试127.0.0.1的连通性,连接失败。

curl -kv 127.0.0.1 8000

29.png

步骤 10     通过如下命令检查数据库连通性,是,指定-h 127.0.0.1

gsql -d postgres -p $port -h 127.0.0.1 -U rdsAdmin -W $password -m -c 'select 1;'

步骤 11     127.0.0.1不通,怀疑是设置了iptable策略,root用户下执行如下命令查看iptable策略。

iptables -L 

2110.png

步骤 12     如上图,iptables策略存在一条策略限制了127.0.0.1访问。

步骤 13     执行如下命令删除限制127.0.0.1的策略。

iptables -D INPUT -p all -s 127.0.0.1/24  -j REJECT 

2130.png

 步骤 14     执行如下命令,测试127.0.0.1的连通性,连接成功。

curl -kv 127.0.0.1 8000

2140.png

  步骤 15     通过gsql连接,也可以连接成功。

2150.png

 步骤 16     管控界面重试任务流,升级成功。

2160.png

2161.png

----结束

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。