- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Hadoop快速入门——第二章、分布式集群（第三节、HDFS Shell的常用命令）

红目香薰发表于 2022/04/20 20:23:58 2022/04/20

【摘要】 Hadoop快速入门——第二章、分布式集群HDFS概述:在 2002 年，Google 发表的论文 GFS 中提到希望构建一个能够运行于商业硬件集群上的以流式数据访问形式存储超大文件的文件系统，HDFS 就是为了实现这一目标HDFS 的设计特点如下超大文件流式数据访问商用硬件不能处理低时间延迟的数据访问不能存放大量小文件无法高效实现多用户写入或者任意修改文件在 HDFS 中有一些特殊的...

Hadoop快速入门——第二章、分布式集群

HDFS概述:

在 2002 年，Google 发表的论文 GFS 中提到希望构建一个能够运行于商业硬件集群上的以流式数据访问形式存储超大文件的文件系统，HDFS 就是为了实现这一目标

HDFS 的设计特点如下

超大文件

流式数据访问

商用硬件

不能处理低时间延迟的数据访问

不能存放大量小文件

无法高效实现多用户写入或者任意修改文件

在 HDFS 中有一些特殊的概念，需要特别重点的理解

数据块:在普通的文件系统中，每个磁盘都有默认的数据块，这是磁盘进行数据读 / 写的最小单位

NameNode:它是 Hadoop 的 HDFS 的核心组件，它维护着文件系统树和整棵树内所有的文件和目录

DataNode: DataNode 是文件系统的工作节点，也就是数据节点，它根据存储需要检索数据块，并定期向 NameNode 发送它所存储的块的列表

SecondNameNode: SecondNameNode 是对主 NameNode 的一个补充，它会周期地执行对 HDFS 元数据的检查点

HDFS 的安全模式:在 NameNode 启动时，首先将镜像文件 fsimage 载入内存，并执行编辑日志 edits 中的各项操作

n数据完整性:在 Hadoop 系统中检测数据完整性是一个常见的措施

常用命令：

hadoop fs -mkdir <paths>

示例：

Mkdir:创建路径中的各级父目录(-p可以创建多级文件夹)

hadoop fs -mkdir -p /user/hadoop/test1

put:从本地文件系统中复制单个或多个源路径到目标文件系统。

get:复制文件到本地文件系统

hadoop fs -get /home/data/save.log newSave.log

mv:移动文件

hadoop fs -mv /home/data/save.log /user/hadoop/newSave.log

cat:输出文件内容

hadoop fs -cat /user/hadoop/newSave.log

ls:返回文件或目录列表信息

hadoop fs -ls /user/hadoop/

ls -R:递归返回文件或目录列表信息

hadoop fs -ls -R /user

touchz:创建一个 0 字节的空文件

hadoop fs -touchz /hello1.log
hadoop fs -touchz /hello2.log
hadoop fs -touchz /hello3.log
hadoop fs -touchz /hello4.log
hadoop fs -touchz /hello5.log

chown:改变文件的拥有者

vi test.sh

hadoop fs -put test.sh /home/test.sh
hadoop fs -ls /home/

修改用户，可以看到从【root】改为【hadoop】

hadoop fs -chown hadoop /home/test.sh
hadoop fs -ls /home/

tail :将文件尾部 1K 字节的内容输出

hadoop fs -tail /home/test.sh

rm -r:删除指定的文件

hadoop fs -rm /home/test.sh

删除后已经无法再次查看文件了。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Hadoop快速入门——第二章、分布式集群（第三节、HDFS Shell的常用命令）

Hadoop快速入门——第二章、分布式集群

HDFS概述:

常用命令：

Mkdir:创建路径中的各级父目录(-p可以创建多级文件夹)

put:从本地文件系统中复制单个或多个源路径到目标文件系统。

get:复制文件到本地文件系统

mv:移动文件

cat:输出文件内容

ls:返回文件或目录列表信息

ls -R:递归返回文件或目录列表信息

touchz:创建一个 0 字节的空文件

chown:改变文件的拥有者

tail :将文件尾部 1K 字节的内容输出

rm -r:删除指定的文件

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Hadoop快速入门——第二章、分布式集群（第三节、HDFS Shell的常用命令）

Hadoop快速入门——第二章、分布式集群

HDFS概述:

常用命令：

Mkdir:创建路径中的各级父目录(-p可以创建多级文件夹)

put:从本地文件系统中复制单个或多个源路径到目标文件系统。

get:复制文件到本地文件系统

mv:移动文件

cat:输出文件内容

ls:返回文件或目录列表信息

ls -R:递归返回文件或目录列表信息

touchz:创建一个 0 字节的空文件

chown:改变文件的拥有者

tail :将文件尾部 1K 字节的内容输出

rm -r:删除指定的文件

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品