- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

华为云GeminiDB Influx接口揭密第八期：GeminiDB Influx接口与开源企业版性能对比

GaussDB 数据库发表于 2022/05/11 09:27:59 2022/05/11

【摘要】 GeminiDB Influx接口较企业版InfluxDB集群能提供更高的写入性能、更低的访问延迟以及更高的数据压缩率

“你们的数据库性能怎么样？”

“能不能满足我们的业务？”

“和其他数据库对比性能有优势么？”

......

客户在使用数据库时常有这样的担心和疑问。

本文从测试方案、测试工具、测试场景、测试结果等方面详细介绍了GeminiDB Influx接口和开源InfluxDB集群在X86架构下的性能测试情况。测试结果显示，GeminiDB Influx接口较企业版InfluxDB集群能提供更高的写入性能、更低的访问延迟以及更高的数据压缩率。

01 测试方案

1.1 资源配置

服务端配置

产品名称	规格	存储	架构
GeminiDB Influx接口	4U16G 2节点	100G	集群架构
开源企业版InfluxDB	4U16G 3节点	100G	集群架构

1.2 测试工具

测试工具为开源性能工具TS-benchMark。

02 测试设计

2.1 测试模型

本次测试采用风力发电数据模型，每个风场50个设备，每个设备50个传感器，1个风场1个线程，通过load数据的线程数来控制时间线的大小，通过收集时间的长短来控制数据量。

模型每条数据大小约为24字节，具体的类型如下：

Timestamp | farm | device |sensor | value

2.2 测试数据量

测试数据分为两个场景，大数据量和小数据量，具体数据量如下：

场景	时间线	数据量
小数据量	5000	4亿
大数据量	250万	GeminiDB Influx接口150亿企业版InfluxDB 47亿

场景

时间线

数据量

小数据量

5000

4亿

大数据量

250万

GeminiDB Influx接口150亿

企业版InfluxDB 47亿

注：企业版InfluxDB在插入到47亿数据时OOM，以下性能对比都基于此数据量。

2.3 测试场景

2.3.1 数据写入场景

batch_size(每个批次写入的数据量) 固定为50，线程数分别从1、2、4、8、16、32、64、128、256、512 递增；
线程数（客户端并发请求的连接数）固定为8， batch_size分别从50、100、150、200、250、300 递增。

2.3.2 数据查询场景

单线程进行不同语句的查询，并统计其时延信息。

第一类查询：所有TAG查询

select * 
from sensor 
where f='f1' and d='d2' and s='s1' and time>=1514768400000000000 and time<=1514772000000000000

第二类查询：TAG+ VALUE查询

select * 
from sensor 
where f='f1' and s='d2' and value>=3.0 and time>=1514768400000000000 and time<1514854800000000000

第三类查询：聚合查询

select mean(value) 
from sensor 
where f='f1' and s='s1' and time>=1514768400000000000 and time<=1514854800000000000 group by f,d,s,time(1h)

第四类查询：或条件查询

select * 
from sensor 
where f='f1' and (s='s1' or s='s2' or s='s3' or s='s4' or s='s5') and time>=1514768400000000000 and time<=1514769150000000000

第五类查询：单个TAG查询

select * 
from sensor 
where f='f1' and time>=1514768400000000000 and time<=1514769150000000000

03 测试结果分析

3.1 写入吞性能比对

在小数据量场景下，GeminiDB Influx接口的写入性能是企业版InfluxDB的13倍左右，在大数据量的场景下可以达到1.8倍左右。

3.2 查询性能对比

1）第一类查询（所有TAG查询）：无论是大数据量还是小数据量场景下，GeminiDB Influx接口的吞吐量是开源InfluxDB企业版的2倍左右。

2）第二类查询（TAG + VALUE查询）：在小数据量场景下，开源InfluxDB企业版性能高于GeminiDB Influx接口，GeminiDB Influx接口在大数据量和小数据量场景下性能基本持平。

3）第三类查询（聚合查询）：GeminiDB Influx接口查询性能明显优于开源InfluxDB企业版，在小数据量场景下是开源版本的14倍，大数据量下也是开源版本的8倍左右。

4）第四类查询（或条件查询）：GeminiDB Influx接口查询性能在两种场景下比较稳定，开源企业版InfluxDB在两种场景下差异较大；GeminiDB Influx接口在小数据量场景下表现优于开源版，在大数据量场景下低于开源版。

5）第五类查询（单个TAG查询）：GeminiDB Influx接口查询性能在两种场景下比较稳定，在大数据量场景下低于开源版。

3.3 数据压缩率对比

在250万时间线场景下，GeminiDB Influx接口导入了151亿条数据，导入前数据大小为337.5G，导入后为49.8G，压缩率为6.8；开源企业版导入了47亿条数据，导入前105G，导入后21.3G，压缩率为4.9。GeminiDB Influx接口压缩率是开源企业版的1.4倍左右。

Influx引擎采用LSM tree架构，随着后台compaction的进行，压缩率会进一步提升，当前数据对比是数据刚导入时的结果。

04 总结

在GeminiDB Influx接口2节点对比开源版3节点场景下，GeminiDB Influx接口给客户带来了更高的写入能力、更稳定的查询能力、更高的压缩率。GeminiDB Influx接口写入能力在小数据量场景下是开源企业版的13倍，在大数据量场景下是开源企业版的1.8倍；查询能力在两种场景下表现稳定，在大部分查询场景下优于开源企业版；在压缩率方面，同样数据模型下，高出开源版本40%。

除了以上优势外，GeminiDB Influx接口还在集群化、冷热分级存储、高可用方面也做了深度优化，能更好地满足时序应用的各种场景。

05 结束

本文作者：华为云数据库创新Lab & 华为云时空数据库团队
欢迎加入我们！
云数据库创新Lab（成都、北京）简历投递邮箱：xiangyu9@huawei.com
华为云时空数据库团队（西安、深圳）简历投递邮箱：yujiandong@huawei.com

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

华为云GeminiDB Influx接口揭密第八期：GeminiDB Influx接口与开源企业版性能对比

01 测试方案

1.1 资源配置

1.2 测试工具

02 测试设计

2.1 测试模型

2.2 测试数据量

2.3 测试场景

03 测试结果分析

3.1 写入吞性能比对

3.2 查询性能对比

3.3 数据压缩率对比

04 总结

05 结束

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

华为云GeminiDB Influx接口揭密第八期：GeminiDB Influx接口与开源企业版性能对比

01 测试方案

1.1 资源配置

1.2 测试工具

02 测试设计

2.1 测试模型

2.2 测试数据量

2.3 测试场景

03 测试结果分析

3.1 写入吞性能比对

3.2 查询性能对比

3.3 数据压缩率对比

04 总结

05 结束

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品