GaussDB(DWS)网卡多队列未配置告警处理指南
GaussDB(DWS)网卡多队列未配置告警处理指南
【问题现象】
FIM界面出现ALM-37028网卡多队列未配置告警:
【正常修复流程】
1、使用omm用户登录告警节点
2、source环境变量
source /opt/huawei/Bigdata/mppdb/.mppdbgs_profile
3、执行修复命令
gs_check -i CheckMultiQueue --set
4、再次检查命令
gs_check –i CheckMultiQueue
5、如果检查结果OK,告警次日自动消除。
【异常场景一】
场景描述:节点做了网卡bond,/etc/sysconfig/network/中bond网卡的配置文件格式为ifcfg-***-bond*(如文件名为ifcfg-bond-bond1),无法使用gs_check正常修复,报错如下:
问题分析:
巡检工具不识别此种bond网卡配置文件命名格式。
解决方法:
1、获取sudo目录路径(如图)
使用root 用户执行crontab -l, 获取红框中的路径
2、加载环境变量
source /opt/huawei/Bigdata/mppdb/.mppdbgs_profile
3、备份同名文件py
cp $GPHOME/script/gspylib/os/gsplatform.py $GPHOME/script/gspylib/os/gsplatform.py.bak
cp /opt/huawei/Bigdata/FusionInsight_MPPDB_6.5.1/install/FusionInsight-MPPDB-6.5.1/package/MPPDB/sudo/gspylib/os/gsplatform.py /opt/huawei/Bigdata/FusionInsight_MPPDB_6.5.1/install/FusionInsight-MPPDB-6.5.1/package/MPPDB/sudo/gspylib/os/gsplatform.py.bak
4、分别将各个节点py按下图修改。(修改的位置在600行。)
文件路径为:
$GPHOME/script/gspylib/os/gsplatform.py
/opt/huawei/Bigdata/FusionInsight_MPPDB_6.5.1/install/FusionInsight-MPPDB-6.5.1/package/MPPDB/sudo /gspylib/os/gsplatform.py
5、执行命令gs_check -i CheckMultiQueue,如果检查结果为NG, 按正常修复流程重新执行。
【异常场景二】
场景描述:执行检查网卡多队列的命令时报zero length field name in format;
问题分析:
版本包自带的gs_check对python2.7以下的版本不兼容。
解决方法:
从support网站下载最新巡检工具,使用巡检工具中的gs_check对网卡多队列进行设置。
【异常场景三】
场景描述:执行检查网卡多队列检查命令时报错Failed to obtain the network card [team0] speed value
问题分析:
巡检工具不识别双网卡team方式。
解决方法:
1、使用如下get_irq_affinity2.sh脚本检查网卡多队列
2、如果检查网卡多队列配置有问题,使用如下smart_irq_affi.sh脚本进行设置
3、确认网卡多队列已配置后,在FIM界面屏蔽网卡多队列未配置告警即可。
【异常场景三】
场景描述:使用gs_check -i CheckMultiQueue --set配置网卡多队列,消除告警后不久告警再次出现。
问题分析:
节点上开启了irqbalance系统服务,irqbalance服务会修改中断配置文件,导致网卡多队列告警再次出现。
解决方法:
关闭irqbalance系统服务。
- 点赞
- 收藏
- 关注作者
评论(0)