- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

三十二、基于Hadoop伪分布式运行Hadoop自带wordcount案例

托马斯-酷涛发表于 2022/05/26 00:17:55 2022/05/26

【摘要】环境背景： Hadoop伪分布式已经搭建完成 Hadoop2.6.0 Hadoop伪分布搭建见： Hadoop伪分布式的搭建详情https://blog.csdn.net/m0_54925305/article/details/118650350?spm=1001.2014.3001.5502https://blog.csdn....

环境背景：

Hadoop伪分布式已经搭建完成

Hadoop2.6.0

Hadoop伪分布搭建见：

Hadoop伪分布式的搭建详情https://blog.csdn.net/m0_54925305/article/details/118650350?spm=1001.2014.3001.5502https://blog.csdn.net/m0_54925305/article/details/118650350?spm=1001.2014.3001.5502

案例实施：

1.启动集群：

2.进入虚拟机浏览器地址栏localhost:50070和localhost:8088查看集群状态：

注：Wordcount是MapReduce的入门示例程序，相当于我们在学某个编程语言时写的Hello World示例一样。这个程序可以统计某个文件中，各个单词出现的次数。Wordcount程序自带的jar包已经放置在hadoop安装目录下的 /share/hadoop/mapreduce 文件夹中。

3.配置wordcount环境：

（1）进入Hadoop安装路径下可以看到：图中的txt文件为Hadoop自带的测试文件，这里将进行自定义文件进行操作。