《Spark数据分析:基于Python语言 》 —1.2.2 Spark的用途
【摘要】 本节书摘来自华章计算机《Spark数据分析:基于Python语言 》 一书中第1章,第1.2.2节,作者是[澳] 杰夫瑞·艾文(Jeffrey Aven) ,王道远 译。
1.2.2 Spark的用途
Spark支持广泛的应用类型,包括如下类别:
抽取-转化-加载(ETL)操作
预测分析和机器学习
数据访问操作,比如SQL查询和可视化
文本挖掘和文本处理
实时事件处理
图应用
模式识别
推荐引擎
在本书写作的时候,全球有超过1500家机构在生产环境中使用Spark,有些机构甚至在几十万节点的集群上运行Spark,操作PB级的数据。
Spark包含许多扩展功能,比如Spark SQL、Spark Streaming(流计算)、SparkR等,这进一步提高了Spark的速度和通用性。
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)