Lv.2
kala_1314
更多个人资料
60
成长值
0
关注
0
粉丝
+ 关注
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
大数据
个人勋章
TA还没获得勋章~
成长雷达
40
0
0
0
20
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
大数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
暂无专栏分类
Hive 函数简介
Hive 函数 一、系统自带的函数 1.查看系统自带的函数有哪些: show functions; 2.显示自带函数的用法: desc function 函数名; 3.详细显示自带函数: desc function extended 函数名 4.调用函数 只需要在hive里面调用函数名并根据函数传入适当的参数就可以了,示例...
Hive
kala_1314
2019-01-18 18:26:32
5596
0
0
2019-01-18 18:26:32
999+
0
0
Hive导入数据与导出数据
一、导入数据的几种方法 1. load 语法: load data [local] inpath '路径' [overwrite] into table '表名'; 将本地的test.txt 导入hive的test表: load data local inpath '/test.txt' overwrite into table test; ...
Hive
kala_1314
2019-01-18 17:11:54
3909
0
0
2019-01-18 17:11:54
999+
0
0
Hive存储格式简单介绍
一、 Hive文件存储格式 Hive支持的存储格式有: textfile、sequencefile、orc和parquet这几种格式。Hive 的存储方式有列式存储和行式存储。 textfile和sequencefile的存储格式是给予行存储的;而orc和parquet是基于列存储的(实质上也不是完全的列存储。 关于行式存储和列式存储: 行存储的特点: 查询满足条件的一整行数据的时候,...
Hive
存储
kala_1314
2019-01-18 16:37:43
3682
0
0
2019-01-18 16:37:43
999+
0
0
Hive数据倾斜
一、什么是数据倾斜:数据倾斜就是key的一些原因,导致分发到不同的reduce上,个别reduce任务特别重,以至于其他reduce都完成了,而这些个别的reduce仍然还需要一些时间才能完成。 发生数据倾斜的远因大概有: 1.输入的文件太多或者大小不一 2.hive的参数设置不合理 3.Hive SQL语句本身的缺陷 ...等等当然,肯定还有很多其他的一些原因会导致数据倾斜,这里只是列举一...
Hive
MapReduce
kala_1314
2019-01-18 14:20:07
3685
0
0
2019-01-18 14:20:07
999+
0
0
Hive的调优一(Fetch抓取)
一、什么是Fetch抓取 Fetch 抓取就是在Hive中对某一些情况的查询不用MapReduce去计算。不是说MapReduce不好,而是在有的情况下用不着,反正会更耗时。举个最简单的例子: select * from dept; 查询部门表的所有信息,在这样的查询条件下,Hive就可以直接读取dept表对应位置下的表,然后输出结果,而不用跑MapReduce去执行这条查询语句。二、...
Hive
kala_1314
2019-01-18 12:42:37
3831
0
0
2019-01-18 12:42:37
999+
0
0
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注