- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【详解】Hadoop3.x运行自带的WordCount报错Containerexitedwithanon-zeroexitcod

皮牙子抓饭发表于 2025/07/23 22:29:38 2025/07/23

【摘要】 Hadoop 3.x 运行自带的 WordCount 报错 Container exited with a non-zero exit code 1在使用 Hadoop 3.x 版本运行经典的 MapReduce 示例程序 WordCount 时，有时会遇到错误信息：“Container exited with a non-zero exit code 1”。本文将探讨该问题的原因及解决方法...

Hadoop 3.x 运行自带的 WordCount 报错 Container exited with a non-zero exit code 1

在使用 Hadoop 3.x 版本运行经典的 MapReduce 示例程序 WordCount 时，有时会遇到错误信息：“Container exited with a non-zero exit code 1”。本文将探讨该问题的原因及解决方法。

问题描述

当尝试运行 Hadoop 自带的 WordCount 程序时，命令如下：

hadoop jar /path/to/hadoop-examples.jar wordcount /input /output

执行上述命令后，可能会看到如下错误信息：

Application application_1576902384745_0001 failed 2 times due to AM Container for appattempt_1576902384745_0001_000001 exited with exitCode: 1
Failing this attempt.Diagnostics: [2019-12-21 12:00:00.000]Exception from container-launch.
Container id: container_e01_1576902384745_0001_01_000001
Exit code: 1

此错误表明 MapReduce 任务的应用管理器容器（AM Container）退出时状态码非零，这通常意味着任务执行过程中遇到了问题。

原因分析

1. 权限问题

最常见的原因之一是文件系统权限设置不当。Hadoop 需要对输入和输出目录具有读写权限。如果这些目录的权限不正确，可能会导致任务失败。

2. 资源不足

另一个常见原因是集群资源不足。例如，如果分配给 Map 或 Reduce 任务的内存不足，可能会导致任务失败。

3. 配置问题

Hadoop 的配置文件（如 core-site.xml, hdfs-site.xml, mapred-site.xml 和 yarn-site.xml）中的某些参数设置不当也可能导致此问题。例如，mapreduce.map.memory.mb 和 mapreduce.reduce.memory.mb 参数设置过低或过高都可能导致任务失败。

4. 输入数据问题

输入数据本身的问题也可能导致任务失败。例如，如果输入文件格式不正确或包含特殊字符，可能会导致 Map 任务无法正常处理数据。

解决方案

1. 检查并调整文件系统权限

确保 Hadoop 用户对输入和输出目录具有适当的读写权限。可以使用以下命令检查和修改权限：

hadoop fs -ls /input
hadoop fs -chmod 777 /input
hadoop fs -ls /output
hadoop fs -chmod 777 /output

2. 检查集群资源

确保集群有足够的资源来运行 MapReduce 任务。可以通过 YARN 的 Web 界面（通常是 http://<ResourceManager>:8088）查看集群资源使用情况，并根据需要调整任务的资源需求。

3. 检查配置文件

检查 Hadoop 配置文件，确保相关参数设置合理。例如，可以调整 mapreduce.map.memory.mb 和 mapreduce.reduce.memory.mb 参数：

<!-- core-site.xml -->
<property>
    <name>mapreduce.map.memory.mb</name>
    <value>1024</value>
</property>
<property>
    <name>mapreduce.reduce.memory.mb</name>
    <value>2048</value>
</property>

4. 检查输入数据

确保输入数据格式正确且没有特殊字符。可以使用 Hadoop 的 fs -cat 命令查看输入文件内容：

hadoop fs -cat /input/*

遇到“Container exited with a non-zero exit code 1”错误时，应从权限、资源、配置和输入数据等方面进行排查。通过逐步检查和调整，通常可以解决问题，使 WordCount 程序顺利运行。以上是一篇关于 Hadoop 3.x 运行 WordCount 报错“Container exited with a non-zero exit code 1”的技术博客文章。希望对你有所帮助！在使用Hadoop 3.x运行WordCount示例时，如果遇到Container exited with a non-zero exit code 1错误，这通常意味着Map或Reduce任务在执行过程中遇到了问题。这种错误可能是由多种原因引起的，例如数据格式不正确、内存不足、依赖库缺失等。

以下是一个简单的WordCount程序示例，以及如何排查和解决这个错误的一些步骤：

WordCount Java 示例代码

import java.io.IOException;
import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCount {

  public static class TokenizerMapper
       extends Mapper<Object, Text, Text, IntWritable>{

    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();

    public void map(Object key, Text value, Context context
                    ) throws IOException, InterruptedException {
      StringTokenizer itr = new StringTokenizer(value.toString());
      while (itr.hasMoreTokens()) {
        word.set(itr.nextToken());
        context.write(word, one);
      }
    }
  }

  public static class IntSumReducer
       extends Reducer<Text,IntWritable,Text,IntWritable> {
    private IntWritable result = new IntWritable();

    public void reduce(Text key, Iterable<IntWritable> values,
                       Context context
                       ) throws IOException, InterruptedException {
      int sum = 0;
      for (IntWritable val : values) {
        sum += val.get();
      }
      result.set(sum);
      context.write(key, result);
    }
  }

  public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
    Job job = Job.getInstance(conf, "word count");
    job.setJarByClass(WordCount.class);
    job.setMapperClass(TokenizerMapper.class);
    job.setCombinerClass(IntSumReducer.class);
    job.setReducerClass(IntSumReducer.class);
    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);
    FileInputFormat.addInputPath(job, new Path(args[0]));
    FileOutputFormat.setOutputPath(job, new Path(args[1]));
    System.exit(job.waitForCompletion(true) ? 0 : 1);
  }
}

排查和解决步骤

检查输入数据：确保输入文件格式正确，没有损坏的数据行。可以通过手动查看输入文件来确认。
增加内存配置：如果任务因为内存不足而失败，可以尝试增加Map或Reduce任务的内存分配。在yarn-site.xml中调整以下参数：

yarn.nodemanager.resource.memory-mb：每个NodeManager的总内存。
yarn.scheduler.maximum-allocation-mb：每个容器的最大内存。
mapreduce.map.memory.mb 和 mapreduce.reduce.memory.mb：Map和Reduce任务的内存。

检查日志：查看YARN和MapReduce的日志文件，这些日志通常位于Hadoop的日志目录下（如/var/log/hadoop/），或者通过Hadoop Web界面访问。日志文件中可能会提供更详细的错误信息。
检查依赖库：确保所有必要的依赖库都已正确安装并可用。特别是在自定义任务中使用了外部库时，需要确保这些库在所有节点上都可用。
调试代码：如果上述步骤都无法解决问题，可以在本地环境中使用相同的输入数据运行WordCount程序，以捕获和调试可能的异常。

运行WordCount

假设你已经编译了WordCount程序并生成了JAR文件（例如wordcount.jar），可以使用以下命令运行WordCount：

hadoop jar wordcount.jar WordCount /input /output

其中/input是输入文件的路径，/output是输出文件的路径。

通过以上步骤，你应该能够诊断并解决Container exited with a non-zero exit code 1的问题。如果问题仍然存在，请提供更多的错误日志信息以便进一步分析。在Hadoop 3.x中运行WordCount示例程序时遇到Container exited with a non-zero exit code 1错误，通常表明YARN容器在尝试执行任务时遇到了问题。这类错误可能是由多种原因引起的，包括但不限于文件权限问题、配置问题、资源不足等。下面是一些可能的原因及解决方法：

1. 文件权限问题

确保所有必要的文件和目录（如输入文件、输出目录）具有正确的读写权限。可以在HDFS上使用hdfs dfs -chmod命令来修改文件或目录的权限。

2. 配置问题

检查Hadoop配置文件（如core-site.xml, hdfs-site.xml, yarn-site.xml等），确保所有配置项都正确无误。特别是mapreduce.framework.name应该设置为yarn，以确保MapReduce作业能够通过YARN调度器运行。

3. 资源不足

如果YARN容器因为资源不足而无法启动，可以尝试调整YARN的资源分配参数，例如增加每个容器的内存或CPU核心数。这可以通过修改yarn-site.xml中的相关配置来实现，如yarn.nodemanager.resource.memory-mb和yarn.nodemanager.resource.cpu-vcores。

4. Java版本不兼容

确保使用的Java版本与Hadoop 3.x兼容。Hadoop 3.x通常要求Java 8或更高版本。可以通过java -version命令检查当前系统上的Java版本，并根据需要安装或更新Java。

5. 日志分析

查看YARN日志可以帮助诊断问题的具体原因。可以通过以下命令获取YARN日志：

yarn logs -applicationId <application_id>

其中<application_id>是你的应用ID，可以通过yarn application -list命令找到。

6. 环境变量问题

确保环境变量（如HADOOP_HOME, JAVA_HOME等）已正确设置。这些变量通常在.bashrc或.profile文件中定义。

示例：运行WordCount并捕获错误

假设你已经编写了一个简单的WordCount程序，并将其打包成一个JAR文件（例如wordcount.jar）。你可以按照以下步骤运行它并捕获可能的错误：

上传输入文件到HDFS：

hdfs dfs -put /path/to/input /input

hdfs dfs -mkdir /output

运行WordCount作业：

hadoop jar /path/to/wordcount.jar org.apache.hadoop.examples.WordCount /input /output

hdfs dfs -ls /output

查看日志：如果作业失败，可以使用以下命令查看日志：

yarn logs -applicationId <application_id>

通过以上步骤，你应该能够更好地理解并解决Container exited with a non-zero exit code 1错误。如果问题仍然存在，建议进一步检查集群的健康状态和配置，或者寻求社区的帮助。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入