- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

大数据Apache Druid（一）：Druid简单介绍和优缺点

Lansonli 发表于 2022/08/17 08:07:11 2022/08/17

【摘要】 Druid简单介绍和优缺点一、什么是Apache DruidDruid（德鲁伊）是一个分布式的、支持实时多维 OLAP 分析、列式存储的数据处理系统，支持高速的实时数据读取处理、支持实时灵活的多维数据分析查询。在Druid数十台分布式集群中支持每秒百万条数据写入，对亿万条数据读取做到亚秒到秒级响应。此外，Druid支持根据时间戳对数据进行预聚合摄入和聚合分析，在时序数据处理分析场景中也可以使...

Druid简单介绍和优缺点

一、什么是Apache Druid

Druid（德鲁伊）是一个分布式的、支持实时多维 OLAP 分析、列式存储的数据处理系统，支持高速的实时数据读取处理、支持实时灵活的多维数据分析查询。在Druid数十台分布式集群中支持每秒百万条数据写入，对亿万条数据读取做到亚秒到秒级响应。此外，Druid支持根据时间戳对数据进行预聚合摄入和聚合分析，在时序数据处理分析场景中也可以使用Druid。

Druid有对应的GUI页面，适用于实时数据提取、高性能查询场景，例如：点击流分析、网络性能监控分析、实时在线OLAP分析等。Druid官网地址：http://druid.apache.org/

注意:阿里巴巴有个开源项目也叫Druid，是一个数据库连接池项目。这里说的Apache Druid与阿里巴巴的Druid没有关系。

二、Druid优缺点

Druid有如下特点，也可以看做是Druid的优点：

列式存储

Druid使用面相列的存储，对于OLAP分析需要读取列分析的场景加快了速度，同时一列数据中有很多共性的数据，数据的压缩效果好，占用空间小，支持快速扫描及聚合查询。

可扩展的分布式架构

Druid在生产环境中可以部署到数十台多数百台服务器组成的集群中，可以提供每秒百万条数据的写入，针对万亿条记录做到亚秒到秒级查询。

支持并行计算

Druid可以在集群中并行执行一个查询。

支持实时或者批量读取数据

Druid支持实时获取数据，实时获取的数据可以实时查询，也支持批量读取数据。

集群自动平衡，方便运维

Druid集群扩大或者缩小时，只需要增加或者减少对应的机器数，Druid集群自动会平衡各个节点，不需要停机。

对数据进行预聚合或预计算

Druid可以人为指定按照某些时间粒度对相同维度的数据进行预聚合计算，既加快了查询速度，也减少了数据存储空间。

bitmap索引快速过滤

Druid中可以通过bitmap构建索引，对数据进行压缩，加快查询过滤速度。

基于时间的分区

Druid首先按照时间对数据进行分区，也可以使用其他字段作为分区，这样可以加快查询速度，例如：基于时间的查询只会查询与时间匹配的分区。

Druid主要的优点在于支持流式和批量数据的导入、高并发亚秒级查询、存储索引优化。但是还有一些缺点，缺点如下：

有限的join能力

Druid适用于清洗好的数据实时写入，不需要更新数据，所以数据在写入Druid之前一般需要拉宽处理，在从Druid中查询数据时，直接查询这张宽表即可。在Druid最新版本0.21.1支持join，join右侧的表都会自动存放内存再做关联，这样会降低性能。

不支持多时间维度，所有维度为String类型
只支持流式写入，不支持实时数据更新，更新可以使用批处理作业完成。
不支持精准去重

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

大数据Apache Druid（一）：Druid简单介绍和优缺点

Druid简单介绍和优缺点

一、什么是Apache Druid

二、Druid优缺点

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

大数据Apache Druid（一）：Druid简单介绍和优缺点

Druid简单介绍和优缺点

一、什么是Apache Druid

二、Druid优缺点

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品