1024华为星际探索夺宝大数据空间之体验华为云大数据serverless服务DLI【我们都是华为云专家】

举报
DevFeng 发表于 2021/11/20 20:41:16 2021/11/20
【摘要】 前言2021年10月24日☼ 星期日 辛丑年(牛) 九月(戊戌) 十九(乙巳)利用华为的大数据技术快速探索星际奥秘。体验步骤一、准备环境开通对象存储服务(OBS)对象存储服务(Object Storage Service,OBS)是一个基于对象的存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,使用时无需考虑容量限制,并且提供多种存储类型供选择,满足客户各类业务场景诉求产品--存...

前言

2021年10月24日 星期日 

辛丑年(牛) 九月(戊戌) 十九(乙巳)

利用华为的大数据技术快速探索星际奥秘。

体验步骤

一、准备环境

开通对象存储服务(OBS)

对象存储服务(Object Storage Service,OBS)是一个基于对象的存储服务,
为客户提供海量、安全、高可靠、低成本的数据存储能力,使用时无需考虑容量限制,
并且提供多种存储类型供选择,满足客户各类业务场景诉求

产品--存储--对象存储服务OBS

选择管理控制台

选择创建桶

上海一局点创建一个空桶,记住桶名称后面要使用

桶名称自定义,这里我取名为“1024”

开通对象存储服务(OBS)

数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark、Apache Flink、openLooKeng(基于Presto)生态,
提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。
企业使用标准SQL、Spark、Flink程序就可轻松完成多数据源的联合计算分析,挖掘和探索数据价值

产品--大数据--数据湖探索DLI

选择进入控制台

进入DLI控制台

创建SQL作业

SQL作业为用户提供标准的SQL,兼容Spark SQL、Presto SQL(基于Apache Presto),
通过可视化界面API、JDBC、ODBC、Beeline等多种接入方式对云上异构数据源进行查询分析,
兼容CSV、JSON、Parquet、Carbon、ORC等主流数据格式。

创建数据库,数据库名称为SPACE

CREATE DATABASE SPACE

创建表,表名称为PHOTO_IMG

CREATE TABLE PHOTO_IMG(  
PHID string,  
IMGID string,  
OPERATOR string,  
EXAMINER string,  
FDATE string
  )using csv options(path"obs://1024/")
注意 path"obs://1024/"  1024 改你自己创建的OBS

然后给表中新增数据

Insert into space.photo_img Values("206","333","joy","amy","20211001");

查询数据

架构图

总结

DLI服务适用于海量日志分析、异构数据源联邦分析、大数据ETL处理。

搭配以下服务使用 OBS、DIS、DGC

并且DLI展示支持多种方式,支持表格展示,折线图,柱状图,饼图和雷达图。

Serverless DLI与自建Hadoop对比优势

优势

维度

数据湖探索 DLI

自建Hadoop系统

低成本

资金成本

按照实际扫描数据量或者CU时收费,可变成本,成本可节约50%。

长期占用资源,资源浪费严重,成本高。

弹性扩缩容能力

基于容器化Kubernetes,具有极致的弹性伸缩能力。

无。

免运维

运维成本

即开即用,Serverless架构。

需要较强的技术能力进行搭建、配置、运维。

高可用

具有跨AZ容灾能力。

高易用

学习成本

学习成本低,包含10年、上千个项目经验固化的调优参数。同时提供可视化智能调优界面。

学习成本高,需要了解上百个调优参数。

支持数据源

  • 云上:OBS、RDS、DWS、CSS、MongoDB、Redis。
  • 云下:自建数据库、MongoDB、Redis。
  • 云上:OBS。
  • 云下:HDFS。

生态兼容

DLV、Tableau、Superset、永洪BI、帆软。

大数据生态工具。

自定义镜像

支持,满足业务多样性。

无。

工作流调度

DGC-DLF调度。

自建大数据生态的调度工具,如Airflow。

企业级多租户

基于表的权限管理,可以精细化到列权限。

基于文件的权限管理。

高性能

性能

基于软硬件一体化的深度垂直优化。

大数据开源版本性能。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。