大数据学习规划

举报
孙中明 发表于 2022/06/22 22:51:58 2022/06/22
【摘要】 阶段时间技能输入输出SQL基础8.4-8.81.表关联方法和特性2.常用基础函数3.窗口函数4.常用优化策略5.hive数据存储格式及压缩格式和特点1、hive编程指南2、SQL 必知必会1、学习笔记2、...
阶段 时间 技能 输入 输出
SQL基础 8.4-8.8 1.表关联方法和特性

2.常用基础函数

3.窗口函数

4.常用优化策略

5.hive数据存储格式及压缩格式和特点
1、hive编程指南

2、SQL 必知必会
1、学习笔记

2、考试
ODEON平台使用 8.4-8.8 1.sql测试方法

2.workflow维护,报错如何查看

3.workflow如何部署

4.coordinate如何部署

5.如何用金蝉平台运维odeon

6.理解每一步的作用和用意
1、odeon帮助文档

2、wiki资料

H-odeon使用QA

http://wiki.iflytek.com/pages/viewpage.action?pageId=362322698
1、workflow、coordinate任务部署且符合规范
数据仓库基础知识 8.8-8.15 1、数据仓库基本概念了解

2、数据仓库维度表、事实表

3、常用维度建模理论

4、熟悉数据仓库相关规范
1、阿里巴巴大数据之路

2、数据仓库生命周期工具箱
1、学习笔记

HDFS知识学习 8.15-8.22 1、hadoop集群搭建

2、分布式计算基础知识学习与mr的原理

3、hdfs原理及常见操作、api等知识学习
1、学习笔记

java/scala基础知识学习(数据开发必选,分析师选学) 8.22-8.29 1.基础语法

2.代码规范

3.集合使用和特点

4、常见函数编程如隐式转换、闭包、部分函数等概念熟悉
1、疯狂java讲义

2、快学scala
1、学习笔记

2、考试
SPARK学习与实践 9月 1、spark基本概念及原理学习

2、spark core相关知识学习

3、dataframe相关算子学习

4、spark sql学习及常见优化
1、学习笔记

KETTLE知识学习 1、熟悉kettle相关概念及基本概念

2、基于kettle完成相关的抽取

3、理解全量抽取、增量抽取,半增量的操作方式

4、熟悉其他如datax等相关的数据同步工具
数据可视化学习与实践 1、了解常见的数据可视化手段如powerBI、echart等

2、基于白泽完成可视化制作

3、熟悉白泽的原理及架构
OLAP相关知识学习 1、熟悉olap相关基础知识

2、对常见的olap数据库如clickhouse、kylin、druid有所了解,对每种olap适合的场景有所认识
HBASE学习与实践 1、学习hbase基础知识,及原理

2、搭建hbase集群

3、熟悉常见的hbase操作
大数据相关算法学习 熟悉大数据中bitmap、bloomfilter、倒排索引等常见的算法

对数据压缩算法有一定得了解
消息队列学习与实践 1、kafka

2、zookeeper
数据架构知识学习 1、了解常见的数据平台架构涉及的相关组件

2、对lambda、kappa架构有所了解

3、熟悉odeon平台的数据架构
实战 数据仓库建模实践
s1、承担2个以上的数据建模任务
2、按照规范输出相关的文档
3、完成任务的上线及运维



spark编程实践
基于spark完成2个以上任务的开发




flink编程实践
基于flink完成一个特定场景的代码上线

文章来源: hiszm.blog.csdn.net,作者:孙中明,版权归原作者所有,如需转载,请联系作者。

原文链接:hiszm.blog.csdn.net/article/details/119426144

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。