suse 12.3 操作系统问题导致cn卡死或频繁重启

举报
你怎么不讲道理 发表于 2020/12/30 20:47:39 2020/12/30
【摘要】 在suse12.3操作系统上,存在已知问题,线程加上mutex锁后,_data._owner字段不会被赋值为本线程号,而是赋值为0(suse 11上会赋值为本线程号),导致数据库线程对mutex锁状态判断错误,重复加锁,陷入死循环如何识别该问题:查看cn日志:failed to join thread xxx, ret is 110, Connection timed out有上面这条日志时...

在suse12.3操作系统上,存在已知问题,线程加上mutex锁后,_data._owner字段不会被赋值为本线程号,而是赋值为0(suse 11上会赋值为本线程号),导致数据库线程对mutex锁状态判断错误,重复加锁,陷入死循环

如何识别该问题:

  1. 查看cn日志:

    failed to join thread xxx, ret is 110, Connection timed out

    有上面这条日志时说明出现此问题

  2. 查看操作系统的CPU模块

    cat /proc/cpuinfo

    在FLAGS中如果存在rtm,说明存在此问题

    image.png

如何规避此问题:

每台CN机器的/opt/huawei/Bigdata/mppdb/.mppdbgs_profile最后增加一行环境变量export LD_LIBRARY_PATH=/lib64/noelision/:$LD_LIBRARY_PATH,然后依次重启om_monitor进程,cm_agent进程,CN进程使环境变量生效


SUSE官网参考:

https://www.suse.com/support/kb/doc/?id=000019071

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。