【手把手带你玩转HetuEngine】(四)HetuEngine数据源对接
前言
HetuEngine能够支持跨源(多种数据源,如Hive,HBase,GaussDB(DWS),Elasticsearch,ClickHouse等),跨域(多个地域或数据中心)的快速联合查询,尤其适用于Hadoop集群(FusionInsight MRS)的Hive、Hudi数据的交互式快速查询场景。本章将对HetuEngine的数据源对接能力与操作实践进行介绍。
数据源对接概述
当前HetuEngine数据源对接支持以下几种能力:
1.支持对接Hive、HBase、GaussDB(DWS),Elasticsearch,ClickHouse、Hudi、IoTDB等多种数据源,并支持对接跨域HetuEngine
2.支持多种数据源的快速联合查询并提供可视化的数据源配置、管理页面,用户可通过HSConsole界面快速添加数据源,并进行差异化配置
3.数据源动态生效,无需重启计算实例
4.支持数据源下推
多数据源对接
当前版本HetuEngine支持对接的数据源如表1所示
表1 HetuEngine对接数据源一览表 |
|||
HetuEngine模式 |
数据源 |
数据源模式 |
支持对接的数据源版本 |
安全模式 |
Hive |
安全模式 |
MRS 3.x、FusionInsight 6.5.1 |
HBase |
MRS 3.x |
||
Elasticsearch |
MRS 3.1.2及以后 |
||
HetuEngine |
MRS 3.1.1及以后 |
||
GaussDB |
GaussDB 200、GaussDB A 8.0.0及以后 |
||
Hudi |
MRS 3.1.2及以后 |
||
ClickHouse |
MRS 3.1.1及以后 |
||
IoTDB |
MRS 3.2.0及以后 |
||
普通模式 |
Hive |
普通模式 |
MRS 3.x、FusionInsight 6.5.1 |
HBase |
MRS 3.x |
||
Elasticsearch |
MRS 3.1.2及以后 |
||
Hudi |
MRS 3.1.2及以后 |
||
ClickHouse |
MRS 3.1.1及以后 |
||
IoTDB |
MRS 3.2.0及以后 |
||
GaussDB |
安全模式 |
GaussDB 200、GaussDB A 8.0.0及以后 |
可视化数据源管理界面
HetuEngine能够支持多种数据源的快速联合查询并提供可视化的数据源配置、管理页面,用户可通过HSConsole界面快速添加数据源,并进行差异化配置。操作示例如下图所示
可以通过最下方“自定义配置”添加相应数据源的自定义配置
数据源动态生效
在HSConsole界面或者使用HSConsole Rest API对数据源的添加、配置、删除等操作支持动态生效,无须重启计算实例。
数据源动态生效时间默认为60秒。如需修改动态生效时间,在计算实例自定义配置添加如下参数,例如:
catalog.scanner-interval =120s
数据源计算下推
HetuEngine支持查询下推(pushdown),它能把查询,或者部分查询,下推到连接的数据源。这意味着特殊的谓词,聚合函数或者其它一些操作,可以被传递到底层数据库或者文件系统进行处理。查询下推能带来以下好处:
- 提升整体的查询性能。
- 减少HetuEngine和数据源之间的网络流量。
- 减少远端数据源的负载。
HetuEngine对查询下推的具体支持情况,依赖于具体的Connector,以及Connector相关的底层数据源或存储系统。
- 点赞
- 收藏
- 关注作者
评论(0)