个人中心
开发者
华为云学院
更多
华为云社区
开发者中心
华为云学院
不温卜火
数据开发工程师
关注:
1
粉丝:
6
+ 关注
发消息
我是不温卜火
收起内容
博客
(201)
201
关注
(1)
7
粉丝
(6)
6
论坛
数据清洗 Chapter01 | 数据清洗概况
这篇文章讲述的是数据存储方式和数据类型等基本概念、数据清洗的必要性和质量评价的关键点。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~ Chapter01 | 数据清洗概况 一、什么是数据1、数据的类型2、表格数据3、属性类别 二、数据清洗1、什么是数据清洗2、为什么要进行数据清洗3、数据存在的问题 三、数据质量评估四、数...
不温卜火
177
0
0
2020-12-02 23:26:32
177
0
0
不知道IDEA的这些个性化配置,你怎么能说自己会用它
IntelliJ IDEA 有很多人性化的设置我们必须单独拿出来讲解,也因为这些人性化的设置让那些 IntelliJ IDEA死忠粉更加死心塌地使用它和分享它。 目录 1. Appearance & Behavior1.1 设置主题1.2 设置窗体及菜单的字体及字体大小1.3 设置编辑区主题1.4 通过插件(plugins)更换主题 2. Edi...
不温卜火
169
0
0
2020-12-02 22:27:33
169
0
0
三分钟教你如何在IDEA中快速创建工程
目录 1. 创建Java工程2. 设置显示常见的视图3. 工程界面显示4. 创建package和class 1. 创建Java工程 1. 打开的初始界面 Create New Project:创建一个新的工程 Import Project:导入一个现有的工程 Open:打开一个已有工程。比如:可以打开 Eclipse 项目。 Check...
不温卜火
169
0
0
2020-12-02 23:23:36
169
0
0
HDFS系列(2) | HDFS优缺点分析
因为在上期的分享中,大家看到的更多是HDFS的底层原理,内部结构,并没有谈到其自身优势和劣势的一个比较!因此,本次博主为大家带来的就是对HDFS的优缺点进行分析。 目录 一. HDFS的优点1. 高容错性2. 适合处理大数据3. 实用性强 二. HDFS的缺点1. 不适合低延时数据访问2. 无法高效的对大量小文件进行存储3. 不支持并发写入、文件...
不温卜火
141
0
0
2020-12-02 22:36:19
141
0
0
HDFS系列(3) | HDFS的Shell常用命令大全
此次更新的的博文是关于HDFS的shell的常用命令,希望大家能够喜欢 目录 一. 基本语法二. 命令大全三. 常用命令实操1. 常用命令及其作用对比表2. 常用命令的实际操作 一. 基本语法 bin/hadoop fs 具体命令 or bin/hdfs dfs 具体命令 都是可以的。 二. 命令大全 在虚拟机内输入:bin/hd...
不温卜火
161
0
0
2020-12-02 23:03:27
161
0
0
HDFS系列(7) | HDFS的 I/O流 API操作
上一篇博文我们分享的API操作HDFS系统都是框架封装好的。那么如果我们想自己实现上述API的操作该怎么实现呢? 此次物品们介绍的是采用I/O流的方式实现数据的上传和下载。 目录 一. HDFS文件上传二. HDFS文件下载三. 定位文件读取 一. HDFS文件上传 需求:把本地d盘上的lisen.txt文件上传到HDFS根目录 1....
不温卜火
142
0
0
2020-12-02 22:57:07
142
0
0
MapReduce快速入门系列(1) | 什么是MapReduce
随着HDFS系列的完结,下面就到了MapReduce系列了,很荣幸各位小伙伴们能够继续一如既往的观看博主的博文。 目录 1. MapReduce的核心思想2. 分布式并行计算框架MapReduce3. MapReduce设计构思1. 如何对付大数据处理:分而治之2. 构建抽象模型:Map和Reduce3. 统一构架,隐藏系统层细节 1....
不温卜火
170
0
0
2020-12-03 00:23:07
170
0
0
MapReduce快速入门系列(2) | 统计输出给定的文本文档每一个单词出现的总次数
相信大家看了博主上一篇博客《什么是MapReduce 》后,对MapReduce的概念有了更深的认知!本篇博客,博主给大家带来的是MapReduce的一个简单的实战项目——统计输出给定的文本文档每一个单词出现的总次数。 目录 1. 创建Maven工程2. 编写程序2.1 编写Mapper类2.2 编写Reducer类2.3 编写Driver驱动类2....
不温卜火
155
0
0
2020-12-02 23:06:37
155
0
0
MapReduce快速入门系列(6) | Shuffle之Partition分区
在之前的博客《MapReduce系列(5) | MapReduce任务流程和shuffle机制的简单解析》,博主为大家分享了MapReduce的整体计算任务流程以及shuffle阶段主要的作用。本篇博客博主分享的是Shuffle之Partition分区详解。 目录 一. Shuffle之Partition分区1.1. 默认Partition分区1.2...
不温卜火
162
0
0
2020-12-02 22:50:30
162
0
0
MapReduce快速入门系列(7) | Shuffle之排序(sort)详解及全排序
上篇博文给大家带来的是分区的介绍以及怎样自定义分区,这次博主为大家带来的是关于排序的博文,希望大家能够喜欢。 目录 一. Shuffle之排序(sort)1.1 排序的简单介绍1.2 排序的分类1.3 自定义排序 二. WritableComparable排序案例2.1 需求2.2 需求分析2.3 编写代码1. FlowBean对象在在需求1基础...
不温卜火
150
0
0
2020-12-02 23:44:28
150
0
0
总条数:201
1
2
3
4
5
...
21
到第
页
确定
上划加载中
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
个人简介
我是不温卜火
感兴趣或擅长的领域:
最新评论
包公论道
2021-03-26 17:14:05
评论了:
快速入门Tableau系列 | Chapter14入门最终章【回归分析和时间序列分析】
包公论道
2021-03-26 17:14:05 评论了:快速入门Tableau系列 | Chapter14入门最终章【回归分析和时间序列分析】