- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《企业级大数据平台构建：架构与实现》——2.5.6　集群模式

华章计算机发表于 2019/06/06 16:29:04 2019/06/06

【摘要】本书摘自《企业级大数据平台构建：架构与实现》——书中第2章，2.5.6节，作者是朱凯。

2.5.6　集群模式

Spark的应用以一组独立进程的形式运行在一个集群之上，由主程序中的SparkContext对象进行协调（也被称为driver程序）。Spark目前支持三种集群运行方式。

具体来说，Spark既可以通过standlone模式独立运行，也可以运行在Mesos或者YARN之上。如图2-17所示，一旦SparkContext连接到集群，Spark首先会从集群的节点中获得一些executor进程，这些进程会用来执行我们程序中的计算和存储逻辑，接着它会通过jar包的形式分发我们的程序代码到各个executor进程。最后，SparkContext会分派任务到各executor进程进行执行。

图2-17　Spark任务进程示意

每个应用都拥有自己的executor进程，这些进程会在整个应用生命周期内持续运行并以多线程的方式执行具体的任务。这种设计的好处是将各个应用之间的资源消耗进行了隔离，每个应用都运行在它们各自的JVM中。但是这也意味着不同应用之间的SparkContext无法共享数据，除非借助扩展的存储媒介。

Spark对底层集群管理不可知。只要能够获取到executor进行，并且这些进程之间可以通信，它就能比较容易的运行在其他通用集群资源调度框架之上，如Mesos和YARN。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

《企业级大数据平台构建：架构与实现》——2.5.6　集群模式

2.5.6　集群模式

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

《企业级大数据平台构建：架构与实现》——2.5.6 集群模式

2.5.6 集群模式

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

《企业级大数据平台构建：架构与实现》——2.5.6　集群模式

2.5.6　集群模式