作者小头像 Lv.3
更多个人资料
254 成长值
1 关注
14 粉丝
+ 关注 私信

个人介绍

华为云云享专家 华为认证大数据HCIE

感兴趣或擅长的领域

人工智能、大数据、数据库、微服务架构、编程语言
个人勋章
TA还没获得勋章~
成长雷达
210
24
0
0
20

个人资料

个人介绍

华为云云享专家 华为认证大数据HCIE

感兴趣或擅长的领域

人工智能、大数据、数据库、微服务架构、编程语言

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
Hive基础(二)-hive的基本概念
2.hive的基本概念 1.hive的概念 hive:是hadoop的一个数据仓库。提供了一个类sql的功能,通过写一个sql语句完成数据的分析。 将结构化的数据映射成一张表 结构化数据: 存有关系的数据(关系型数据库)、有一定规则的文本 半结构化数据:非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、Email等。 非结构化数据:没有固定模式的...
作者小头像 百忍成金的虚竹
1703
0
0
2021-03-25 23:53:27
999+
0
0
Hive基础(五)-hive参数的调优
8.hive参数的调优 ​ 1.fetch抓取 ​ 2.本地模式开启 ​ 3.表的优化 ​ 1)小表join大表 ​ 对于我们来说,尽量把小表放前面;再进一步,可以使用group by将比较小的表放在map端进行数据加载和处理。 ​ select count(distinct s_id) from score; ​ select count(s_id...
作者小头像 百忍成金的虚竹
1505
0
0
2021-03-26 01:53:15
999+
0
0
flink集成hudi
Flink.png flink 1.12.2 hudi 0.9.0 一、组件下载 1.1、flink1.12.2编译包下载: https://mirrors.tuna.tsinghua.edu.cn/apache/flink/flink-1.12.2/flink-1.12.2-bin-scala_2.11.tgz 1.2、hudi编译: git clone htt...
作者小头像 百忍成金的虚竹
2650
1
1
2021-04-04 00:18:34
999+
1
1
虚竹_语录1
image.png 0、批评也是我的必须品,因为批评不是别人的攻击,而是忠言逆耳。 1、今天模棱两可,差、不多的态度,会导致明天的高不成,低不就的尴尬。 2、让优秀刻到骨髓里。 3、你可以把扯淡看成幽默,你也可以把贪图安逸看成有趣。你可以把多话看成性格外向。但在我的眼里,没有成就的这些表现属于浮躁,属于投机取巧,属于不成熟。 4、去枝蔓,立主干。抓住重点去努力,会...
作者小头像 百忍成金的虚竹
631
0
0
2021-03-29 03:05:54
631
0
0
虚竹_语录2
1、羞怯也是人的一大障碍,热情会让人感觉彬彬有礼。 2、脸皮厚是优点,但是如果不看情况的脸皮厚,只会让人更讨厌。 3、矜持确实是好事,但如果发展到看重面子和自尊,就走向了畸形。 4、做人不能太贪心,舍与得之间必须要做出选择。 5、有时候善良一点,吃了亏真是一件好事。 6、有时候拼搏了,奋斗了,拼尽了力气,还没有好的结果。不能抱怨老天不公,不能抱怨自己背景不好,不能抱怨别人。那怎...
作者小头像 百忍成金的虚竹
621
0
0
2021-03-29 03:14:28
621
0
0
ES几种常见的聚合操作
普通聚合 POST /product/_search { "size": 0, "aggs": { "agg_city": { "terms": { "field": "departureCitys" //字段 } } } } 父子结构的索引的聚合 POST product/_search { "size": 0, "aggs": { "months": { "c...
作者小头像 百忍成金的虚竹
1601
0
0
2021-03-29 01:21:21
999+
0
0
简书markdown写技术博客
一 准备工作 网页版的简书,一个自己的账号. 点击头像,选择"设置"修改常用编辑器为"markdown",默认的为"富文本". 点击"写文章",就可以新建一篇文稿 二 markdown语法 1 标题 标题是所有文章里最需要用到的,直接展示了文章的思路架构. 在 Markdown 中,标题的格式为:# 标题 有几个#号就表示为几级标题, 总共六级. “#”和标题之间要加空格,这是...
作者小头像 百忍成金的虚竹
2025
0
0
2021-03-29 01:32:21
999+
0
0
07. Flink8种分区策略及源码解读
Flink8种分区策略有哪几种? Flink实现的分区策略继承图:.png GlobalPartitioner: DataStream => DataStream GlobalPartitioner数据会被分发到下游算子的第一个实例中进行处理。 GlobalPartitioner,GLOBAL分区。`将记录输出到下游Operator的第一个实例。 源码解读: /*...
作者小头像 百忍成金的虚竹
1483
0
0
2021-04-02 04:49:33
999+
0
0
SparkSQL
Spark sql 的属性 ① 易整合: 可以通过sql开发对应的应用程序, 也可以使用java/scala/phython/R编写的API来开发 ② 统一的数据源访问: 可以使用相同的方式来连接到不同的数据源 // 即: sparkSession.read.文件格式(文件路径) ③ 兼容hive: 可以使用spark sql来操作hive sql ④ 标准的数据连接: sp...
作者小头像 百忍成金的虚竹
1552
0
0
2021-03-25 23:52:09
999+
0
0
揭秘hive常见面试题(一)-20道
1)hive 的使用,内外部表的区别,分区作用, UDF 和 Hive 优化 (1)hive 使用:仓库、工具 (2)hive 内部表:加载数据到 hive 所在的 hdfs 目录,删除时,元数据和数据文件都删除 外部表:不加载数据到 hive 所在的 hdfs 目录,删除时,只删除表结构。 (3)分区作用:防止数据倾斜 (4)UDF 函数:用户自定义的函数 (主要解决格式,计...
作者小头像 百忍成金的虚竹
1763
0
0
2021-03-29 01:15:38
999+
0
0
总条数:209
  • 1
  • ...
  • 17
  • 18
  • 19
  • 20
  • 21
到第 页

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注 私信