Lv.1
杜子
更多个人资料
20
成长值
0
关注
2
粉丝
+ 关注
私信
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
大数据
个人勋章
TA还没获得勋章~
成长雷达
20
0
0
0
0
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
大数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
暂无专栏分类
【SPARK调优】spark调优之小文件合并
一、问题现象 我们有一个15万条总数据量133MB的表,使用SELECT * FROM bi.dwd_tbl_conf_info全表查询耗时3min,另外一个500万条总数据量6.3G的表ods_tbl_conf_detail,查询耗时23秒。两张表均为列式存储的表。 大表查询快,而小表反而查询慢了,为什么会产生如此奇怪的现象呢?二、问题探询 数据量6.3G的表查...
EI企业智能
杜子
2021-05-12 16:38:11
10470
0
2
2021-05-12 16:38:11
999+
0
2
如何利用数据湖探索进行账单分析与优化
数据湖探索(DLI)作为华为云大数据分析平台,计费项有存储费用与计算费用,计费类型有包周期,包套餐和按需。本文简单介绍下DLI的计费,并使用华为云DLI上的实际消费数据(文中涉及账户的信息已脱敏),在DLI的大数据分析平台上分析,找出费用优化的空间,并给出使用DLI过程中降成本的一些措施。一、DLI的计费简介数据湖探索服务目前支持三种作业:SQL作业,Flink作业和Spark作业。SQL作...
大数据
EI企业智能
DLI
杜子
2020-07-23 20:11:44
9610
1
1
2020-07-23 20:11:44
999+
1
1
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注