数据仓库入门浅谈
数据仓库是商业智能(业务智能、BI)的基础。概念看起来简单,把数据存在静态的仓库里头以便多个维度分析,但实现和应用较复杂困难。
几个值得注意的要点:
1)数据仓库跟业务执行系统的管理要点完全不同。按事实和维度存储,减少执行流程和执行角色的干扰
2)数据仓库要基于精准的业务需要来建立,系统分析与设计要求深入了解业务概念和业务流程。
3)数据仓库的存储数据偏静态,但是使用过程是动态不固定的。并非用几个dashboard和KPI模板看固定的格式数据就是数据仓库。真正的价值在于业务分析和BI的数据推送结合,起到量化分析、有效支撑决策作用。
4)数据仓库能实现而其他工具难以实现的几个特性:
快速汇总(例如三年总发货量)
数据切片(例如三年使用空运发货到俄罗斯地区部的发货量)
多维查看(例如同时对比Q1-Q4季度,各个地区部的各种运输方式发货量)
维度旋转(例如从时间维度看到Q4空运延迟较多,可以改从方式维度看空运延迟是否在Q4最严重)
上下钻取(例如看到Q4空运延迟较多,细看哪个地区部最多,再细看这个地区部哪个LSP最多
例如看到本月某国某大货量空运箱单成本极高,汇总看地区部空运成本,再汇总看季度全球空运成本)
数据仓库跟业务执行系统的不同点
业务执行系统OLTP数据 | 数据仓库OLAP数据 |
原始数据 | 导出数据 |
细节性数据 | 综合性和提炼性数据 |
当前值数据 | 历史数据 |
可更新 | 不可更新,但周期性刷新 |
一次处理的数据量小 | 一次处理的数据量大 |
面向应用,事务驱动 | 面向分析,分析驱动 |
面向操作人员,支持日常操作 | 面向决策人员,支持管理需要 |
作者 | 陈鹰
转载请注明出处:华为云博客 https://portal.hwclouds.com/blogs
- 点赞
- 收藏
- 关注作者
评论(0)