【云享读书会-数据仓库工具箱】DAY01 数据仓库、商业智能及维度建模初步
总体内容概览:
1)DW和BI的相关概念
2)Kimball的DW/BI架构与Inmon的CIF架构
3)HW的DWS服务
一、数据获取 vs 数据分析
数据获取是OLTP的范畴,其特点包括:
1)大量事务
2)低延迟
3)轻量级
4)读写均衡
5)对数据历史状态不敏感,更关注最新状态数据
数据分析属于OLAP范畴,其特点:
1)单位时间事务量级低
2)大吞吐量
3)重量级
4)Heavy read
5)对数据历史状态变化敏感,需要长周期的数据历史
二、DW/BI的目标
1)信息易访问:简单、快捷
2)一致的形式展现信息:数据可信
3)适应变化:架构的稳定性和健壮性
4)及时展现:高实效性
5)安全堡垒:有效控制
6)决策依据:权威性和可信基础
7)数据可用:系统成功
三、维度建模 vs 第三范式
1)数据发布:业务用户要能理解发布的数据
2)查询性能:提供高效的查询性能
数据集市大部分都采用维度建模方式,而不会采用第三范式
四、星型模型&多维数据库
关键词:fact事实表,cube多维模型,报表
维度模型中的事实表用来存储企业或组织的商业行为事件所产生的可度量的绩效结果。
要点:
1)事实表中的行记录和度量事件是一对一的关系
2)可加类型,半可加类型和不可加类型
3)事务表三种粒度:事务表,周期快照表,累计快照表
五、Kimball的DW/BI架构
两个核心需求:
1)以商业用户可理解的方式发布数据
2)提供高效的查询性能
六、Inmon的CIF(Corporate Information Factory)架构
七、混合辐射架构
八、华为的DWS服务
要点:
1)全并行无中心的MPP架构
2)基于Shared-Nothing无共享分布式架构
- 点赞
- 收藏
- 关注作者
评论(0)