- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

大数据实战【千亿级数仓】阶段五

大数据梦想家发表于 2021/09/29 01:02:37 2021/09/29

【摘要】         本篇博客，为大家带来的是关于大数据实战【千亿级数仓】阶段五的内容。   &nbsp...

本篇博客，为大家带来的是关于大数据实战【千亿级数仓】阶段五的内容。

该阶段中我们需要达成的目标有：

学习、掌握kylin的使用,使用kylin，为数据仓库内的数据进行预计算

关于Kylin的入门及使用安装，具体的内容可以参考博主写的kylin专栏的内容：
👉Kylin

所以本篇博客，为大家带来的则是如何将Kylin与我们的数仓项目进行结合，即使用Kylin，为数据仓库内的ads层结果数据进行预计算处理。

基于Kylin开发Ads层

项目需求介绍

因为业务需要，公司运营部门，希望随时能够自己编写SQL语句，快速获取到不同维度数据的指标，故基于Kylin OLAP分析平台，搭建快速OLAP分析平台。

业务开发

开发步骤：

创建 itcast_shop 项目
导入dw层宽表数据
创建数据模型
创建Cube立方体
构建立方体
执行查询

具体操作步骤：

在kylin中导入数据源

创建model

指定model名称：

选择事实表：

创建完了Model，接着我们需要创建Cube，创建Cube就需要根据我们根据业务需求中所书写的SQL语句进行操作。

这里举一个在前面阶段我们所求得的SQL指标的例子。

全国、无商品分类维度的交易信息

需求：

获取全国、无商品分类维度的分交易类型数据
获取全国、无商品分类维度的不分交易类型的数据

对应的SQL

-- 获取全国、无商品分类维度的分交易类型数据
select
    paytype,
    count(distinct orderid) total_cnt,
    sum(goodsprice) total_money
from
    itcast_dw.TMP_ORDER_GOODS_CAT_ORG
group by paytype;

-- 获取全国、无商品分类维度的不分交易类型的数据
select
    '9' as paytype,
    count(distinct orderid) total_cnt,
    sum(goodsprice) total_money
from
    itcast_dw.TMP_ORDER_GOODS_CAT_ORG;

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16

全国、一级商品分类维度交易信息

需求：

获取全国、一级商品分类维度的分交易类型数据
获取全国、一级商品分类维度的不分交易类型数据

对应的SQL

-- 1、获取全国、一级商品分类维度的分交易类型数据
select
    firstcat,
    paytype,
    count(distinct orderid) total_cnt,
    sum(goodsprice) total_money
from
    itcast_dw.TMP_ORDER_GOODS_CAT_ORG
group by firstcat, paytype;

-- 2、获取全国、一级商品分类维度的不分交易类型数据
select
    firstcat,
    count(distinct orderid) total_cnt,
    sum(goodsprice) total_money
from
    itcast_dw.TMP_ORDER_GOODS_CAT_ORG
group by firstcat;

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17
  18

获取到SQL指标之后，我们就可以创建Cube立方体，并build构建立方体，最后再根据SQL语句，在线进行查询即可。

因为这里面所涉及到的Kylin基本的流程操作。而博主在之前的博客kylin入门实操已经为大家较为详细地介绍了kylin的操作流程，所以这里就不再做过多的赘述。

大家在领悟了Kylin的基本流程之后，根据已有的SQL，利用Kylin进行加速查询还是比较容易的。

小结

大数据实战【千亿级数仓】阶段五的内容到这里就结束了。大家需要在了解Kylin基本操作的基础上，对我们数仓项目ads数据层的数据进行预处理，加速查询！！！

如果以上过程中出现了任何的纰漏错误，烦请大佬们指正😅

受益的朋友或对大数据技术感兴趣的伙伴记得点赞关注支持一波🙏

文章来源: alice.blog.csdn.net，作者：大数据梦想家，版权归原作者所有，如需转载，请联系作者。

原文链接：alice.blog.csdn.net/article/details/106245790

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

大数据实战【千亿级数仓】阶段五