【yarn】yarn某个节点nodemanager日志查看不了问题解决方法

举报
钧瑜 发表于 2023/10/21 14:55:48 2023/10/21
【摘要】 在生产中,如果登录yarn页面,查看application任务日志,发现日志查看不了,该怎么办问题报错:问题原因:去显示的任务节点上查看nodemanager日志,发现是当前存储yarn日志的hdfs单个目录下文件数量已经达到最大值1048576,所以yarn日志聚合不了,导致查看不了yarn日志聚合:由于NodeManager将所有Container的运行日志保存到本地磁盘上,因此,随着时...

在生产中,如果登录yarn页面,查看application任务日志,发现日志查看不了,该怎么办

问题报错:

问题原因:
去显示的任务节点上查看nodemanager日志,发现是当前存储yarn日志的hdfs单个目录下文件数量已经达到最大值1048576,所以yarn日志聚合不了,导致查看不了

yarn日志聚合:
由于NodeManager将所有Container的运行日志保存到本地磁盘上,因此,随着时间的积累,日志必将越来越多。为了避免大量Container日志“撑爆”磁盘空间,NodeManager将定期清理日志文件,该功能由组件LogHandler(当前存在两种实现:NonAggregatingLogHandler和LogAggregationService)完成。
除定期删除外,NodeManager还提供了另一种日志处理方式——日志聚集转存,管理员可通过将配置参数yarn.log-aggregation-enable置为true启用该功能。
该机制将HDFS作为日志聚集仓库,它将应用程序产生的日志上传到HDFS上,以便统一管理和维护。

解决方法:
1.首先查看yarn的配置文件参数 yarn.nodemanager.remote-app-log-dir,他就是container上传到hdfs的目录
2.在后台,通过命令
hdfs dfs -count  /目录名   #查看上传的该目录下,有多少文件

3.查看命令结果,如果>=1048576,就将该目录删除

4.重新登录yarn,查看任务日志,发现已经可以查看了

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。