- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《大数据技术丛书Flink原理、实战与性能优化》—1.4　Flink基本架构

华章计算机发表于 2019/06/01 22:17:35 2019/06/01

【摘要】本书摘自《大数据技术丛书Flink原理、实战与性能优化》一书中的第1章，第1.4.1节，编著是张利兵。

1.4　Flink基本架构

1.4.1　基本组件栈

在Flink整个软件架构体系中，同样遵循着分层的架构设计理念，在降低系统耦合度的同时，也为上层用户构建Flink应用提供了丰富且友好的接口。

从图1-5中可以看出整个Flink的架构体系基本上可以分为三层，由上往下依次是 API & Libraries层、Runtime核心层以及物理部署层。

API&Libraries层

作为分布式数据处理框架，Flink同时提供了支撑流计算和批计算的接口，同时在此基础之上抽象出不同的应用类型的组件库，如基于流处理的CEP（复杂事件处理库）、SQL&Table库和基于批处理的FlinkML（机器学习库）等、Gelly（图处理库）等。API层包括构建流计算应用的DataStream API和批计算应用的DataSet API，两者都提供给用户丰富的数据处理高级API，例如Map、FlatMap操作等，同时也提供比较低级的Process Function API，用户可以直接操作状态和时间等底层数据。

图1-5　Flink基本组件栈

Runtime核心层

该层主要负责对上层不同接口提供基础服务，也是Flink分布式计算框架的核心实现层，支持分布式Stream作业的执行、JobGraph到ExecutionGraph的映射转换、任务调度等。将DataSteam和DataSet转成统一的可执行的Task Operator，达到在流式引擎下同时处理批量计算和流式计算的目的。

物理部署层

该层主要涉及Flink的部署模式，目前Flink支持多种部署模式：本地、集群（Standalone/YARN）、云（GCE/EC2）、Kubenetes。Flink能够通过该层能够支持不同平台的部署，用户可以根据需要选择使用对应的部署模式。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

《大数据技术丛书Flink原理、实战与性能优化》—1.4　Flink基本架构

1.4　Flink基本架构

1.4.1　基本组件栈

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

《大数据技术丛书Flink原理、实战与性能优化》—1.4 Flink基本架构

1.4 Flink基本架构

1.4.1 基本组件栈

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

《大数据技术丛书Flink原理、实战与性能优化》—1.4　Flink基本架构

1.4　Flink基本架构

1.4.1　基本组件栈