三十二、基于Hadoop伪分布式运行Hadoop自带wordcount案例

举报
托马斯-酷涛 发表于 2022/05/26 00:17:55 2022/05/26
【摘要】 环境背景: Hadoop伪分布式已经搭建完成 Hadoop2.6.0 Hadoop伪分布搭建见: Hadoop伪分布式的搭建详情https://blog.csdn.net/m0_54925305/article/details/118650350?spm=1001.2014.3001.5502https://blog.csdn....

环境背景:

Hadoop伪分布式已经搭建完成

Hadoop2.6.0

Hadoop伪分布搭建见:

Hadoop伪分布式的搭建详情https://blog.csdn.net/m0_54925305/article/details/118650350?spm=1001.2014.3001.5502icon-default.png?t=L892https://blog.csdn.net/m0_54925305/article/details/118650350?spm=1001.2014.3001.5502

案例实施:

1.启动集群:

 2.进入虚拟机浏览器地址栏localhost:50070localhost:8088查看集群状态:

 

       注:Wordcount是MapReduce的入门示例程序,相当于我们在学某个编程语言时写的Hello World示例一样。这个程序可以统计某个文件中,各个单词出现的次数。Wordcount程序自带的jar包已经放置在hadoop安装目录下的 /share/hadoop/mapreduce 文件夹中。

3.配置wordcount环境:

        (1)进入Hadoop安装路径下可以看到:图中的txt文件为Hadoop自带的测试文件,这里将进行自定义文件进行操作。

         (2)在这里我们新建wordcount.txt文件进行测试,文本内容如下:

 

        (3)在HDFS根目录下新建input目录:

        (4)将本地的wordcount.txt上传到HDFS的input目录下:

        (5)查看文件是否上传成功:          

注:如图出现/input和/input/wordcount.txt文件即为上传成功

4.运行wordcount案例:

注:使用hadoop jar命令 +mapreduce自带的jar包路径(绝对路径)+文件名+输入路径+输出路径        #此处jar包根据自身实际情况进行修改

        运行过程注意观察这几处字样,即为运行成功:

 

5.查看运行结果:

        再次查看运行结果文件:

         可以看到,程序运行产生了很多文件,其中/output/part -r -00000即为程序运行完成时的结果文件,如下图:

基于Hadoop伪分布式运行Hadoop自带wordcount案例完成

文章来源: tuomasi.blog.csdn.net,作者:托马斯-酷涛,版权归原作者所有,如需转载,请联系作者。

原文链接:tuomasi.blog.csdn.net/article/details/120326488

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。