【云享读书会-数据仓库工具箱】DAY01 数据仓库、商业智能及维度建模初步

举报
真爱无敌 发表于 2020/01/20 10:40:09 2020/01/20
【摘要】 总体内容概览:1)DW和BI的相关概念2)Kimball的DW/BI架构与Inmon的CIF架构3)HW的DWS服务一、数据获取 vs 数据分析数据获取是OLTP的范畴,其特点包括:1)大量事务2)低延迟3)轻量级4)读写均衡5)对数据历史状态不敏感,更关注最新状态数据数据分析属于OLAP范畴,其特点:1)单位时间事务量级低2)大吞吐量3)重量级4)Heavy read5)对数据历史状态变化...

image.png

总体内容概览:

1)DW和BI的相关概念

2)Kimball的DW/BI架构与Inmon的CIF架构

3)HW的DWS服务


一、数据获取 vs 数据分析

数据获取是OLTP的范畴,其特点包括:

1)大量事务

2)低延迟

3)轻量级

4)读写均衡

5)对数据历史状态不敏感,更关注最新状态数据


数据分析属于OLAP范畴,其特点:

1)单位时间事务量级低

2)大吞吐量

3)重量级

4)Heavy read

5)对数据历史状态变化敏感,需要长周期的数据历史


二、DW/BI的目标

1)信息易访问:简单、快捷

2)一致的形式展现信息:数据可信

3)适应变化:架构的稳定性和健壮性

4)及时展现:高实效性

5)安全堡垒:有效控制

6)决策依据:权威性和可信基础

7)数据可用:系统成功


三、维度建模 vs 第三范式

1)数据发布:业务用户要能理解发布的数据

2)查询性能:提供高效的查询性能

数据集市大部分都采用维度建模方式,而不会采用第三范式


四、星型模型&多维数据库

关键词:fact事实表,cube多维模型,报表

维度模型中的事实表用来存储企业或组织的商业行为事件所产生的可度量的绩效结果。

要点:

1)事实表中的行记录和度量事件是一对一的关系

2)可加类型,半可加类型和不可加类型

3)事务表三种粒度:事务表,周期快照表,累计快照表


五、Kimball的DW/BI架构

两个核心需求:

1)以商业用户可理解的方式发布数据

2)提供高效的查询性能

image.png

spacer.gif

六、Inmon的CIF(Corporate Information Factory)架构

image.png

spacer.gif

七、混合辐射架构

image.png

spacer.gif

八、华为的DWS服务

要点:

1)全并行无中心的MPP架构

2)基于Shared-Nothing无共享分布式架构

image.png

spacer.gif


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。