数据仓库入门浅谈

举报
大数据小粉 发表于 2017/04/26 11:44:15 2017/04/26
【摘要】 数据仓库是商业智能(业务智能、BI)的基础。概念看起来简单,把数据存在静态的仓库里头以便多个维度分析,但实现和应用较复杂困难。

数据仓库是商业智能(业务智能、BI)的基础。概念看起来简单,把数据存在静态的仓库里头以便多个维度分析,但实现和应用较复杂困难。

几个值得注意的要点:

1)数据仓库跟业务执行系统的管理要点完全不同。按事实和维度存储,减少执行流程和执行角色的干扰

2)数据仓库要基于精准的业务需要来建立,系统分析与设计要求深入了解业务概念和业务流程。

3)数据仓库的存储数据偏静态,但是使用过程是动态不固定的。并非用几个dashboard和KPI模板看固定的格式数据就是数据仓库。真正的价值在于业务分析和BI的数据推送结合,起到量化分析、有效支撑决策作用。

4)数据仓库能实现而其他工具难以实现的几个特性:

   快速汇总(例如三年总发货量)

   数据切片(例如三年使用空运发货到俄罗斯地区部的发货量)

   多维查看(例如同时对比Q1-Q4季度,各个地区部的各种运输方式发货量)

   维度旋转(例如从时间维度看到Q4空运延迟较多,可以改从方式维度看空运延迟是否在Q4最严重)

   上下钻取(例如看到Q4空运延迟较多,细看哪个地区部最多,再细看这个地区部哪个LSP最多

   例如看到本月某国某大货量空运箱单成本极高,汇总看地区部空运成本,再汇总看季度全球空运成本)

数据仓库跟业务执行系统的不同点

业务执行系统OLTP数据

数据仓库OLAP数据

原始数据

导出数据

细节性数据

综合性和提炼性数据

当前值数据

历史数据

可更新

不可更新,但周期性刷新

一次处理的数据量小

一次处理的数据量大

面向应用,事务驱动

面向分析,分析驱动​

面向操作人员,支持日常操作

面向决策人员,支持管理需要

作者 | 陈鹰

转载请注明出处:华为云博客 https://portal.hwclouds.com/blogs

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。