《从零开始学Hadoop大数据分析(视频教学版)》 —3.2.4 HDFS的执行原理
【摘要】 本节书摘来自华章计算机《从零开始学Hadoop大数据分析(视频教学版)》 一书中第3章,第3.2.4节,作者是温春水 毕洁馨 。
3.2.4 HDFS的执行原理
从客户端传入文件读写请求时,NameNode(HDFS的集群管理节点)首先接受客户端的读写服务请求,并根据它保存的Metadata元数据,包括元数据的镜像文件(fsimage和操作日志edits信息)和DataNode(数据存储)通信并进行资源协调,Secondary NameNode进行edits和fsimage的合并,同时DataNode之间进行数据复制。
如果要存储一个大文件,首先要将文件分割成块,分别放到不同的节点,每块文件都有3个副本备份,并且有一个专门记录文件块存放情况的元数据文件以备查询,如图3.2和图3.3所示。
图3.2 大文件存储1
图3.3 大文件存储2
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)