Lv.1
大数据修行者
更多个人资料
53
成长值
2
关注
1
粉丝
+ 关注
私信
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
个人勋章
TA还没获得勋章~
成长雷达
50
3
0
0
0
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
暂无专栏分类
使用MRS CDL实现实时数据同步的极致性能
使用MRS CDL实现实时数据同步的极致性能- Chetan Kothari 华为印度首席架构师MRS CDL提供从多个RDBMS捕获CDC事件并复制到大数据生态系统的机制,以实现实时数据湖分析和实时DWH场景。解决性能问题是数据复制解决方案解决低延迟、高吞吐量使用情形的关键要求之一。实时数据复制性能通常使用以下两个属性来衡量 吞吐量:在一个时间窗口中可以处理多少GB的事务日志卷、行或...
EI企业智能
FusionInsight
MapReduce
MapReduce服务 MRS
大数据
大数据修行者
2021-08-30 12:28:31
11306
0
1
2021-08-30 12:28:31
999+
0
1
基于CarbonData的电信时空大数据探索
基于CarbonData的电信时空大数据探索-- 张军、龚云骏1 使用场景随着万物互联的时代到来,以及智慧终端普及,现实世界超过80%的数据与地理位置相关,比如日常使用的社交、支付、出行相关APP。作为IOT最底层的无线通信网络也会生成大量与位置相关的数据,用于无线通信网络规划和优化,帮助电信运营商建设更好体验的精品网络,构建万物互联的信息社会。为表征无线网络相关指标在地理空...
EI企业智能
FusionInsight
MapReduce服务 MRS
大数据
智能数据
大数据修行者
2021-08-25 19:51:27
9436
1
1
2021-08-25 19:51:27
999+
1
1
Make Apache Spark better with CarbonData
Spark 无疑是一个强大的处理引擎和一个用于更快处理的分布式集群计算框架。不幸的是,Spark在一些方面也存在不足。如果我们将 Apache Spark 与 Apache CarbonData 结合使用,它可以克服这些不足:1. 不支持 ACID transaction2. 没有quality enforcement3. 小文件问题4. 低效的data skipping什么是ACID?Sp...
FusionInsight
大数据
智能数据
大数据修行者
2021-06-24 11:19:22
10488
0
0
2021-06-24 11:19:22
999+
0
0
Apache CarbonData、Hudi及Open Delta的对比研究
背景 我们已经看到,人们更热衷于高效可靠的解决方案,拥有为数据湖提供应对突变和事务处理的能力。在数据湖中,用户基于一组数据生成报告是非常常见的。随着各种类型的数据汇入数据湖,数据的状态不会一层不变。需要改变各种数据的用例包括随时间变化的时序数据、延迟到达的时延数据、平衡实时可用性和回填、状态变化的数据(如CDC)、数据快照、数据清理等,在生成报告时,这些都将被写入/更新在同一组...
EI企业智能
FusionInsight
大数据
大数据修行者
2020-10-26 19:29:21
9937
2
1
2020-10-26 19:29:21
999+
2
1
用物化视图提高CarbonData查询性能
物化视图是一个预计算数据集,是大数据系统中最重要的查询性能调优工具之一,它允许用户预先连接复杂的视图和预计算摘要,以获得快速的响应时间。在CarbonData中,实例化视图通过执行相关查询投影、筛选器以及聚合和连接等昂贵操作的预计算,有助于提高性能。利用Carbon表上的实例化视图,我们可以避免不必要的大表全表扫描,从而加快查询速度。 物化视图助力Apache ...
大数据
FusionInsight
EI企业智能
大数据修行者
2020-10-19 12:33:12
9403
1
1
2020-10-19 12:33:12
999+
1
1
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注