1024华为星际探索夺宝大数据空间之体验华为云大数据serverless服务DLI【我们都是华为云专家】
前言
2021年10月24日☼ 星期日
辛丑年(牛) 九月(戊戌) 十九(乙巳)
利用华为的大数据技术快速探索星际奥秘。
体验步骤
一、准备环境
开通对象存储服务(OBS)
对象存储服务(Object Storage Service,OBS)是一个基于对象的存储服务,
为客户提供海量、安全、高可靠、低成本的数据存储能力,使用时无需考虑容量限制,
并且提供多种存储类型供选择,满足客户各类业务场景诉求
产品--存储--对象存储服务OBS
选择管理控制台
选择创建桶
在上海一局点创建一个空桶,记住桶名称后面要使用
桶名称自定义,这里我取名为“1024”
开通对象存储服务(OBS)
数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark、Apache Flink、openLooKeng(基于Presto)生态,
提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。
企业使用标准SQL、Spark、Flink程序就可轻松完成多数据源的联合计算分析,挖掘和探索数据价值
产品--大数据--数据湖探索DLI
选择进入控制台
进入DLI控制台
创建SQL作业
SQL作业为用户提供标准的SQL,兼容Spark SQL、Presto SQL(基于Apache Presto),
通过可视化界面API、JDBC、ODBC、Beeline等多种接入方式对云上异构数据源进行查询分析,
兼容CSV、JSON、Parquet、Carbon、ORC等主流数据格式。
创建数据库,数据库名称为SPACE
CREATE DATABASE SPACE
创建表,表名称为PHOTO_IMG
CREATE TABLE PHOTO_IMG(
PHID string,
IMGID string,
OPERATOR string,
EXAMINER string,
FDATE string
)using csv options(path"obs://1024/")
注意 path"obs://1024/" 1024 改你自己创建的OBS
然后给表中新增数据
Insert into space.photo_img Values("206","333","joy","amy","20211001");
查询数据
架构图
总结
DLI服务适用于海量日志分析、异构数据源联邦分析、大数据ETL处理。
并且DLI展示支持多种方式,支持表格展示,折线图,柱状图,饼图和雷达图。
Serverless DLI与自建Hadoop对比优势
优势 |
维度 |
数据湖探索 DLI |
自建Hadoop系统 |
---|---|---|---|
低成本 |
资金成本 |
按照实际扫描数据量或者CU时收费,可变成本,成本可节约50%。 |
长期占用资源,资源浪费严重,成本高。 |
弹性扩缩容能力 |
基于容器化Kubernetes,具有极致的弹性伸缩能力。 |
无。 |
|
免运维 |
运维成本 |
即开即用,Serverless架构。 |
需要较强的技术能力进行搭建、配置、运维。 |
高可用 |
具有跨AZ容灾能力。 |
无 |
|
高易用 |
学习成本 |
学习成本低,包含10年、上千个项目经验固化的调优参数。同时提供可视化智能调优界面。 |
学习成本高,需要了解上百个调优参数。 |
支持数据源 |
|
|
|
生态兼容 |
DLV、Tableau、Superset、永洪BI、帆软。 |
大数据生态工具。 |
|
自定义镜像 |
支持,满足业务多样性。 |
无。 |
|
工作流调度 |
DGC-DLF调度。 |
自建大数据生态的调度工具,如Airflow。 |
|
企业级多租户 |
基于表的权限管理,可以精细化到列权限。 |
基于文件的权限管理。 |
|
高性能 |
性能 |
基于软硬件一体化的深度垂直优化。 |
大数据开源版本性能。 |
- 点赞
- 收藏
- 关注作者
评论(0)