suse 12.3 操作系统问题导致cn卡死或频繁重启
【摘要】 在suse12.3操作系统上,存在已知问题,线程加上mutex锁后,_data._owner字段不会被赋值为本线程号,而是赋值为0(suse 11上会赋值为本线程号),导致数据库线程对mutex锁状态判断错误,重复加锁,陷入死循环如何识别该问题:查看cn日志:failed to join thread xxx, ret is 110, Connection timed out有上面这条日志时...
在suse12.3操作系统上,存在已知问题,线程加上mutex锁后,_data._owner字段不会被赋值为本线程号,而是赋值为0(suse 11上会赋值为本线程号),导致数据库线程对mutex锁状态判断错误,重复加锁,陷入死循环
如何识别该问题:
-
查看cn日志:
failed to join thread xxx, ret is 110, Connection timed out
有上面这条日志时说明出现此问题
-
查看操作系统的CPU模块
cat /proc/cpuinfo
在FLAGS中如果存在rtm,说明存在此问题
如何规避此问题:
在每台CN机器的/opt/huawei/Bigdata/mppdb/.mppdbgs_profile最后增加一行环境变量export LD_LIBRARY_PATH=/lib64/noelision/:$LD_LIBRARY_PATH,然后依次重启om_monitor进程,cm_agent进程,CN进程使环境变量生效
SUSE官网参考:
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)