【手把手带你玩转HetuEngine】(一)HetuEngine快速上手

举报
HetuEngine九级代言 发表于 2023/07/01 18:52:36 2023/07/01
【摘要】 《手把手带你玩转HetuEninge》系列文章旨在从业务场景,集群规划,业务规划,集群调优等多个角度出发,由浅入深带你快速了解和使用HetuEngine,进入交互式查询的世界,体验极速的大数据查询。 HetuEngine是华为推出的高性能交互式SQL分析及数据虚拟化引擎。与大数据生态无缝融合,实现海量数据秒级交互式查询;支持跨源跨域统一访问,使能数据湖内、湖间、湖仓一站式SQL融合分析。

前言

《手把手带你玩转HetuEninge》系列文章旨在从业务场景,集群规划,业务规划,集群调优等多个角度出发,由浅入深带你快速了解和使用HetuEngine,进入交互式查询的世界,体验极速的大数据查询。

HetuEngine是什么

HetuEngine是华为推出的高性能交互式SQL分析及数据虚拟化引擎。与大数据生态无缝融合,实现海量数据秒级交互式查询;支持跨源跨域统一访问,使能数据湖内、湖间、湖仓一站式SQL融合分析。

HetuEngine适合做什么

1.1.png

  1. 适用于Hadoop集群(FusionInsight MRS)的Hive、Hudi数据源的交互式快速查询场景;
  2. 适用于跨源(多种数据源,如Hive,Hudi,HBase,GaussDB(DWS),Elasticsearch,ClickHouse等)查询;
  3. 适用于跨域(多个地域或数据中心)的快速联合查询;
  4. 不擅长大批量、复杂逻辑的跑批处理、创建事务、数据入库操作等。

HetuEngine特点

特点 说明
统一SQL 支持标准的SQL,用户可以使用标准的SQL进行数据查询和分析计算
多数据源 支持对接多种数据源,如Hive、Hudi、Hbase、Clickhouse、Elasticsearch、Gaussdb、iotdb等多种数据源
高性能 完全的内存计算,自动实现计算下推,动态过滤等,实现PB级数据毫秒级响应
跨源跨域 支持多种数据源的跨源跨域联合分析查询,一条SQL实现多源协同、湖仓协同
高并发高可用
算力、并发可横向扩展,弹性伸缩,自动路由,自动实时调配超大SQL的计算规模
智能加速 基于收益最大化原则,实现对热查询的自动识别、预计算与在线分析加速,IO降低90%
智能运维 支持SQL诊断,快速定位出质量欠佳的SQL记录及用户信息,辅助管理员提前预判潜在风险

 

HetuEngine基本架构

HetuEngine面向企业级能力方面,构建了极致稳定、高性能的企业级交互式分析引擎。

  1. 云服务层:提供了企业级的运维管理监控能力,认证与业务接入统一访问入口,友好的可视化界面操作,一键式参数调优和配置,协助用户轻松简单的管理集群平台;
  2. 引擎层:纯计算引擎部署,与数据解耦;自容错,节点故障级别重启,内存溢出保护等;计算实例基于任务负载自动弹性伸缩,可水平横向扩展;
  3. 数据层:支持多种常见的数据源间的联合查询,同时计算和数据解耦,天然的存算分离架构。

1.2.png

HetuEngine服务角色

 

模块名称

常见概念名称

描述

云服务层

HetuEngine CLI/JDBC

HetuEngine的客户端,使用者通过客户端向服务端提交查询请求,然后将执行结果取回并展示。

HSBroker

HetuEngine的服务管理,用作计算实例的资源管理校验,健康监控与自动维护等。

HSConsole

对外提供数据源信息管理,计算实例管理,自动化任务的查看等功能的可视化操作界面和RESTful接口。

HSFabric

提供SQL统一访问入口及跨域(DC)高性能安全数据传输。

QAS

HetuEngine的自研模块,针对SQL执行历史记录提供自动感知、自动学习、自动诊断服务,提升在线SQL运维能力,自动加速在线SQL分析任务。

引擎层

Coordinator

HetuEngine计算实例的管理节点,提供SQL接收、SQL解析、生成执行计划、执行计划优化、分派任务和资源调度等能力。

Worker

HetuEngine计算实例的工作节点,提供数据源数据并行拉取,分布式SQL计算等能力。

 

HeuEngine引擎架构

HetuEngine引擎执行流程简单介绍:

1.3.png

Coordinator

负责管理Worker节点,以及接受客户端查询请求,并进行SQL的语法解析(Parser)、执行计划生成与优化(Plannner)和查询任务的调度(Scheduler)

Worker

负责具体的查询计算和数据读写

Discovery Server

负责发现集群的各个节点,用于节点间心跳监控

快速上手指南

工欲善其事必先利其器,在使用HetuEngine之前,首先需要了解基本的架构,并与业务场景相结合,然后进行集群相关的规划和配置,最后进行业务对接和验证上线。本系列将从以下几方面内容手把手带你玩转HetuEngine。

1.4.png

  1. 了解HetuEngine的基本架构:了解HetuEngine是什么
  2. 了解HetuEngine常见的应用场景,与业务场景相结合:判断HetuEngine是否适应于业务场景
  3. 集群部署和资源规划:前期的资源规划必不可少
  4. 数据源添加和管理:对接业务需要的数据源
  5. 权限管控和配置:保障不同业务用户之间的权限管控
  6. 业务对接:业务对接和验证
  7. 性能调优:不同的调优手段
  8. 运行过程中常见问题排查:常见问题的处理方式
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。