《Spark数据分析:基于Python语言 》 —1.2.2 Spark的用途

举报
华章计算机 发表于 2020/02/12 16:58:38 2020/02/12
【摘要】 本节书摘来自华章计算机《Spark数据分析:基于Python语言 》 一书中第1章,第1.2.2节,作者是[澳] 杰夫瑞·艾文(Jeffrey Aven) ,王道远 译。

1.2.2 Spark的用途

Spark支持广泛的应用类型,包括如下类别:

  • 抽取-转化-加载(ETL)操作

  • 预测分析和机器学习

  • 数据访问操作,比如SQL查询和可视化

  • 文本挖掘和文本处理

  • 实时事件处理

  • 图应用

  • 模式识别

  • 推荐引擎

在本书写作的时候,全球有超过1500家机构在生产环境中使用Spark,有些机构甚至在几十万节点的集群上运行Spark,操作PB级的数据。

Spark包含许多扩展功能,比如Spark SQL、Spark Streaming(流计算)、SparkR等,这进一步提高了Spark的速度和通用性。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。