- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《大数据技术丛书Flink原理、实战与性能优化》—2.4.2　运行程序

华章计算机发表于 2019/06/01 22:43:32 2019/06/01

【摘要】本书摘自《大数据技术丛书Flink原理、实战与性能优化》一书中的第2章，第2.4.2节，编著是张利兵。

2.4.2　运行程序

启动Scala Shell交互式解释器后，就可以进行Flink流式应用或批量应用的开发。需要注意的是，Flink已经在启动的执行环境中初始化好了相应的Environment，分别使用“benv”和“senv”获取批量计算环境和流式计算环境，然后使用对应环境中的API开发Flink应用。以下代码实例分别是用批量和流式实现WordCount的应用，读者可以直接在启动Flink Scala Shell客户端后执行并输出结果。

通过Scala-Shell运行批量计算程序，调用benv完成对单词数量的统计。

scala> val textBatch = benv.fromElements(

"To be, or not to be,--that is the question:--",

"Whether 'tis nobler in the mind to suffer")

scala> val counts = textBatch

.flatMap { _.toLowerCase.split("\\W+") }

.map { (_, 1) }.groupBy(0).sum(1)

scala> counts.print()

通过Scala-Shell运行流式计算，调用senv完成对单词数量的统计。

scala> val textStreaming = senv.fromElements(

"flink has Stateful Computations over Data Streams")

scala> val countsStreaming = textStreaming

.flatMap { _.toLowerCase.split("\\W+") }

.map { (_, 1) }.keyBy(0).sum(1)

scala> countsStreaming.print()

scala> senv.execute("Streaming Wordcount")

注意用户在使用交互式解释器方式进行应用开发的过程中，流式作业和批量作业中的一些操作（例如写入文件）并不会立即执行，而是需要用户在程序的最后执行env.execute(“appname”)命令，这样整个程序才能触发运行。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

《大数据技术丛书Flink原理、实战与性能优化》—2.4.2　运行程序

2.4.2　运行程序

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

《大数据技术丛书Flink原理、实战与性能优化》—2.4.2 运行程序

2.4.2 运行程序

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

《大数据技术丛书Flink原理、实战与性能优化》—2.4.2　运行程序

2.4.2　运行程序