数据仓库入门浅谈
【摘要】 数据仓库是商业智能(业务智能、BI)的基础。概念看起来简单,把数据存在静态的仓库里头以便多个维度分析,但实现和应用较复杂困难。
数据仓库是商业智能(业务智能、BI)的基础。概念看起来简单,把数据存在静态的仓库里头以便多个维度分析,但实现和应用较复杂困难。
几个值得注意的要点:
1)数据仓库跟业务执行系统的管理要点完全不同。按事实和维度存储,减少执行流程和执行角色的干扰
2)数据仓库要基于精准的业务需要来建立,系统分析与设计要求深入了解业务概念和业务流程。
3)数据仓库的存储数据偏静态,但是使用过程是动态不固定的。并非用几个dashboard和KPI模板看固定的格式数据就是数据仓库。真正的价值在于业务分析和BI的数据推送结合,起到量化分析、有效支撑决策作用。
4)数据仓库能实现而其他工具难以实现的几个特性:
快速汇总(例如三年总发货量)
数据切片(例如三年使用空运发货到俄罗斯地区部的发货量)
多维查看(例如同时对比Q1-Q4季度,各个地区部的各种运输方式发货量)
维度旋转(例如从时间维度看到Q4空运延迟较多,可以改从方式维度看空运延迟是否在Q4最严重)
上下钻取(例如看到Q4空运延迟较多,细看哪个地区部最多,再细看这个地区部哪个LSP最多
例如看到本月某国某大货量空运箱单成本极高,汇总看地区部空运成本,再汇总看季度全球空运成本)
数据仓库跟业务执行系统的不同点
业务执行系统OLTP数据 | 数据仓库OLAP数据 |
原始数据 | 导出数据 |
细节性数据 | 综合性和提炼性数据 |
当前值数据 | 历史数据 |
可更新 | 不可更新,但周期性刷新 |
一次处理的数据量小 | 一次处理的数据量大 |
面向应用,事务驱动 | 面向分析,分析驱动 |
面向操作人员,支持日常操作 | 面向决策人员,支持管理需要 |
作者 | 陈鹰
转载请注明出处:华为云博客 https://portal.hwclouds.com/blogs
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)