大数据技术学习——大数据架构

举报
slx_share 发表于 2023/01/31 20:01:37 2023/01/31
【摘要】 大数据架构是对大数据平台整体结构和组件的抽象描述,指导系统各方面的实施。

1       一句话介绍

大数据架构是对大数据平台整体结构和组件的抽象描述,指导系统各方面的实施。

2       大数据平台层次架构

  • 数据平台层:负责数据采集、存储、处理。
  • 数据服务层:负责开发数据服务接口、流程、服务。

数据服务层的主要作用是屏蔽底层数据库变动对业务系统的影响。例如因业务增加,底层需要分库分表时,业务层无需跟着变动,完全由数据服务层实现对底层数据的操作。

  • 数据应用层:跟具体业务相关的数据应用。
  • 数据管理层:负责数据管理以及系统管理。

3       传统数据架构

传统数据架构即BI系统架构,以CUBE为核心,支持多维度分析。缺点也很明显:

  • 不支持非结构化数据
  • TB/PB级别数据分析吃力

4       Lambda架构

数据通道分成实时流以及离线流的架构。

优点:

  • 稳定。
  • 实时计算与离线计算错峰调度。

缺点:

  • 实时计算与离线计算计算框架不一致,导致计算结果不一致。
  • 需要开发、运维两套程序,且两套程序内部处理模块冗余,运维成本高。

5       Kappa架构

Kafka等消息队列代替数据通道,合并实时与离线数据流。依赖Kafka的消息回放实现历史数据离线处理(或将历史数据存储在数据湖)。


优点:

  • 维护一套代码即可。
  • 计算口径一致。

缺点:

  • 回溯订正历史数据资源压力大

6       Unified架构(统一架构)

统一架构将机器学习与数据处理结合。在流处理层添加模型训练层。


7       参考

https://insights.thoughtworks.cn/common-big-data-infrastructure/

http://3ms.huawei.com/km/groups/3319023/blogs/details/10424867

https://cloud.tencent.com/developer/article/1769585

https://developer.aliyun.com/article/752406

https://www.jianshu.com/p/26cfed05d2c8

 

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。