云社区
数据湖探索 DLI
# 数据湖探索 DLI #
博客
111
【生态对接】Tableau工具对接DLI
由于Tableau已经与阿里MaxCompute的jdbc做了生态对接,但是tableau生态是不支持dli jdbc的,所以我们需要做生态适配,本文通过Apache kyuubi来拉通dli与tableau之间的链接
yd_256036135
330
0
0
SQL
数据湖探索 DLI
【快捷部署】002_Flink(1.17.2)
快捷部署系列,本期带来的是Flink,快速体验、学习
云叔记
911
0
0
Flink
数据仓库
数据湖探索 DLI
数据中台:始于阿里,兴于DaaS
企业只有把数据用起来了,才能反向推动数据治理和数据标准类似的工作,而数据治理的推进也会让数据服务化更好,让业务更好的使用数据,这其实也是企业数字化转型的方向和重要目标:让数据用起来。
麦聪
6240
0
1
API
企业数字化
云数据仓库 GaussDB(DWS)
数据湖探索 DLI
数据湖(一):数据湖概念
数据湖概念一、什么是数据湖数据湖是一个集中式的存储库,允许你以任意规模存储多个来源、所有结构化和非结构化数据,可以按照原样存储数据,无需对数据进行结构化处理,并运行不同类型的分析对数据进行加工,例如:大数据处理、实时分析、机器学习,以指导做出更好地决策。二、大数据为什么需要数据湖当前基于Hive的离线数据仓库已经非常成熟,在传统的离线数据仓库中对记录级别的数据进行更新是非常麻烦的,需要对待...
Lansonli
3349
0
3
Kafka
大数据
数据湖探索 DLI
数据湖(三):Hudi概念术语
大数据联盟地址:https://bbs.csdn.net/forums/lanson 文章目录 Hudi概念术语 一、Timeline 二、文件格式及索引 三、表类型 1、Copy On Write - COW 2、Merge On Read - MOR...
Lansonli
2629
0
1
数据湖探索 DLI
数据湖(二):什么是Hudi
https://bbs.csdn.net/forums/lansonhttps://bbs.csdn.net/forums/lanson 文章目录 什么是Hudi 什么是Hudi Apache Hudi是一个Data Lakes的开源方案,Hudi是Hadoop Updates and Incrementals的简写,...
Lansonli
3107
1
1
数据湖探索 DLI
【云小课】EI第39课 MRS基础原理之Hudi介绍
Hudi是数据湖的文件组织层,对Parquet格式文件进行管理提供数据湖能力,支持多种计算引擎。
Hello EI
5363
2
4
MapReduce
大数据
数据湖探索 DLI
hive语法创建分区表,方便CDM做增量导出
背景:数据湖里面建表,可以使用DataSource语法或Hive语法 ,两种建表语法创建的OBS表(即外表)在运行job时,在分区表下的文件夹路径会有所不同,DataSource语法创建的OBS分区表路径生成无规律,不利于CDM做数据的增量导出。
roger_0936
5260
0
0
Hive
spark
云数据迁移 CDM
数据湖探索 DLI
在ModelArts Notebook中连接DLI Spark集群进行电商BI报表分析
本文将介绍如何基于
wyhhyw123
6176
0
0
AI开发平台ModelArts
SQL
数据湖探索 DLI
在ModelArts Notebook中连接DLI Spark集群并进行机器学习建模
本文将介绍如何基于ModelArts Notebook连接DLI远程Spark集群,并基于Sparkmagic魔法命令将本地的iris数据集发送至Spark集群,进而基于PySpark进行简单的数据探索性分析、特征工程和构建随机森林模型进行预测。
wyhhyw123
5603
0
0
AI开发平台ModelArts
spark
数据湖探索 DLI
总条数:111
到第
页
确定
热门标签
Java
Python
数据结构
Linux
数据库
机器学习
网络
任务调度
MySQL
JavaScript