Spark---SparkCore(三)
【摘要】 一、Spark广播变量和累加器1、广播变量1)、广播变量理解图2)、广播变量使用val conf = new SparkConf()conf.setMaster("local").setAppName("brocast")val sc = new SparkContext(conf)val broadCast = sc.broadcast(list)val lineRDD = sc.t...
一、Spark广播变量和累加器
1、广播变量
1)、广播变量理解图
2)、广播变量使用
3)、注意事项
能不能将一个RDD使用广播变量广播出去?
不能,因为RDD是不存储数据的。可以将RDD的结果广播出去。
广播变量只能在Driver端定义,不能在Executor端定义。
在Driver端可以修改广播变量的值,在Executor端无法修改广播变量的值。
2、累加器
1)、累加器理解图
2)、累加器的使用
3)、注意事项
累加器在Driver端定义赋初始值,累加器只能在Driver端读取,在Excutor端更新。
二、Spark weibui界面
1、SparkUI界面介绍
可以指定提交Application的名称
2、配置historyServer
1)、临时配置,对本次提交的应用程序起作用
停止程序,在Web Ui中Completed Applications对应的ApplicationID中能查看history。
2)、spark-default.conf配置文件中配置HistoryServer,对所有提交的Application都起作用
在客户端节点,进入../spark-1.6.0/conf/ spark-defaults.conf最后加入:
启动HistoryServer:
访问HistoryServer:node4:18080,之后所有提交的应用程序运行状况都会被记录。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)