Kylin快速入门系列(2) | Kylin的快速入门

举报
不温卜火 发表于 2021/01/07 19:07:54 2021/01/07
【摘要】   大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只有csdn这一个平台,博客...

  大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只有csdn这一个平台,博客主页:https://buwenbuhuo.blog.csdn.net/

  此篇为大家带来的是Kylin的快速入门。


20

一. 数据准备

  在Hive中创建数据,分别创建部门和员工外部表,并向表中导入数据。

  • 1. 用到的元素数据
    1
  • 2. 建表
// 1.创建部门表
create external table if not exists default.dept(
deptno int,
dname string,
loc int
)
row format delimited fields terminated by '\t';


  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
// 2.创建员工表
create external table if not exists default.emp(
empno int,
ename string,
job string,
mgr int,
hiredate string, 
sal double, 
comm double,
deptno int)
row format delimited fields terminated by '\t';


// 3. 查看创建的表
hive> show tables;

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

2

  • 3. 向外部表中导入数据
// 1.导入数据
hive (default)> load data local inpath '/opt/module/datas/dept.txt' into table default.dept;
hive (default)> load data local inpath '/opt/module/datas/emp.txt' into table default.emp;
// 2.查询结果
hive (default)> select * from emp;
hive (default)> select * from dept;


  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

3

二. 创建项目

1. 登录系统

4

2. 创建工程

  • 1. 点击图上所示“+”号
    5
  • 2. 填入项目名及描述点击Submit
    6

3. 选择数据源

  • 1. 选择加载数据源方式
    7
  • 2. 导入数据
    8
  • 3. 查看数据源
    9

三. 创建Model

  • 1. 回到Models页面
    10

  • 2. 点击New按钮后点击New Model
    11

  • 3.填写Model名称及描述后Next
    12

  • 4.选择事实表
    13

  • 5.添加维度表
    14

  • 6.选择添加的维度表及join字段
    15

  • 7.选择维度信息
    16

  • 8.选择度量信息
    17

  • 9.添加分区信息及过滤条件之后“Save”
    18

  • 10.创建Model完成
    19

四. 创建Cube

1.点击New按钮然后选择New Cube
20
2.选择Model及填写Cube Name
21
3.添加维度
22
23
4.添加需要做预计算的内容
24
25
26
5.动态更新相关(默认)
27
6.高阶模块(默认)
28
7.需要修改的配置
29
8.Cube信息展示
30
9.Cube配置完成
31
10.触发预计算
32
11.查看Build进度
33
12.构建Cube完成
34

五. Hive和Kylin性能对比

需求:根据部门名称[dname]统计员工薪资总数[sum(sal)]

1. Kylin查询

1.进入Insight页面
35
2.在New Query中输入查询语句并Submit

select dept.dname,sum(emp.sal) from emp join dept on emp.deptno = dept.deptno group by dept.dname;

  
 
  • 1

36
第二次执行
37
3.数据图表展示及导出
38
4.图表展示之条形图
39
5.图表展示之饼图
40

2. Hive查询

hive> select dept.dname,sum(emp.sal) from emp join dept on emp.deptno = dept.deptno group by dept.dname;

  
 
  • 1

41
  本次的分享就到这里了,


11

  好书不厌读百回,熟读课思子自知。而我想要成为全场最靓的仔,就必须坚持通过学习来获取更多知识,用知识改变命运,用博客见证成长,用行动证明我在努力。
  如果我的博客对你有帮助、如果你喜欢我的博客内容,请“点赞” “评论”“收藏”一键三连哦!听说点赞的人运气不会太差,每一天都会元气满满呦!如果实在要白嫖的话,那祝你开心每一天,欢迎常来我博客看看。
  码字不易,大家的支持就是我坚持下去的动力。点赞后不要忘了关注我哦!

13
12

文章来源: buwenbuhuo.blog.csdn.net,作者:不温卜火,版权归原作者所有,如需转载,请联系作者。

原文链接:buwenbuhuo.blog.csdn.net/article/details/106242517

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。