《Spark Streaming实时流式大数据处理实战》 ——2.2.2 本地集群模式
【摘要】 本节书摘来自华章计算机《Spark Streaming实时流式大数据处理实战》 —— 书中第2章,第2.2.2节,作者是肖力涛 。
2.2.2 本地集群模式
除了本地模式之外,Spark还提供了一种用于本地测试和调试的模式,就是本地集群模式,该模式会利用当前的单一机器启动多个进程来模拟集群的分布式场景,相比local[N]模式中多个线程分享一个进程的资源,这种模式会更加接近真实的集群环境。通常我们会在部署到集群前,对程序做进一步的测试。
与local[N]模式类似,我们也可以利用运行时参数master local-cluster[x,y,z]或者调用SetMaster("local-cluster[x,y,z]")两种方式来启动集群模式。利用local-cluster[x,y,z]的形式分别对executor的数量x、每个executor的core数量y及内存空间大小z进行设置。
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)