MRS集群功能介绍- Kudu
【摘要】 Kudu是专为Apache Hadoop平台开发的列式存储管理器,具有Hadoop生态系统应用 程序的共同技术特性:在通用的商用硬件上运行,可水平扩展,提供高可用性。 Kudu的设计具有以下优点: ● 能够快速处理OLAP工作负载 ● 支持与MapReduce,Spark和其他Hadoop生态系统组件集成 ● 与Apache Impala的紧密集成,使其成为将HDFS与Apache Parq...
Kudu是专为Apache Hadoop平台开发的列式存储管理器,具有Hadoop生态系统应用 程序的共同技术特性:在通用的商用硬件上运行,可水平扩展,提供高可用性。
Kudu的设计具有以下优点:
● 能够快速处理OLAP工作负载
● 支持与MapReduce,Spark和其他Hadoop生态系统组件集成
● 与Apache Impala的紧密集成,使其成为将HDFS与Apache Parquet结合使用的更 好选择
● 提供强大而灵活的一致性模型,允许您根据每个请求选择一致性要求,包括用于 严格可序列化的一致性的选项
● 提供同时运行顺序读写和随机读写的良好性能
● 易于管理
● 高可用性。Master和TServer采用raft算法,该算法可确保只要副本总数的一半以 上可用,tablet就可以进行读写操作。例如,如果3个副本中有2个副本或5个副本 中有3个副本可用,则tablet可用。即使主tablet出现故障,也可以通过只读的副 tablet提供读取服务
● 支持结构化数据模型 通过结合所有以上属性,Kudu的目标是支持在当前Hadoop存储技术上难以实现或无 法实现的应用。
Kudu的应用场景有:
● 需要终用户立即使用新到达数据的报告型应用
● 同时支持大量历史数据查询和细粒度查询的时序应用
● 使用预测模型并基于所有历史数据定期刷新预测模型来做出实时决策的应
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)