《从零开始学Hadoop大数据分析(视频教学版)》 —3.2.3 HDFS的优点和缺点
【摘要】 本节书摘来自华章计算机《从零开始学Hadoop大数据分析(视频教学版)》 一书中第3章,第3.2.3节,作者是温春水 毕洁馨 。
3.2.3 HDFS的优点和缺点
1.HDFS的优点
* 高容错性:数据自动保存多个副本,副本丢失后自动恢复。
* 适合批处理:移动计算而非数据,数据位置暴露给计算机框架。
* 适合大数据处理:GB、TB,甚至PB级数据,百万规模以上的文件数量,10k+节点。
* 可构建在廉价机器上:通过副本提高可靠性,提供了容错和恢复机制。
2.HDFS的缺点
* 不适合低延时数据访问:寻址时间长,适合读取大文件,低延迟与高吞吐率。
* 不适合小文件存取:占用NameNode大量内存,寻找时间超过读取时间。
* 并发写入、文件随机修改:一个文件只能有一个写入者,仅支持append(日志),不允许修改文件。
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)