[ms]为什么选择parquet及orc和parquet区别
【摘要】 spark支持parquet
hive支持parquet
csv存储的大小与实际文件大小一样,若没有压缩,占用容量=实际大小*副本数目
parquet完美实现分区过滤
列修剪
参考:为什么选择parquet
orc:先划分行组,然后再划分成一列列再存储
image.png
HIVE存储格式ORC、PARQUET对比
spark支持parquet
hive支持parquet
csv存储的大小与实际文件大小一样,若没有压缩,占用容量=实际大小*副本数目
parquet完美实现分区过滤
列修剪
参考:为什么选择parquet
orc:先划分行组,然后再划分成一列列再存储
文章来源: www.jianshu.com,作者:百忍成金的虚竹,版权归原作者所有,如需转载,请联系作者。
原文链接:www.jianshu.com/p/085adee24175
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)