《从零开始学Hadoop大数据分析(视频教学版)》 —1.1.5 大数据计算模式

举报
华章计算机 发表于 2019/12/14 16:40:58 2019/12/14
【摘要】 本节书摘来自华章计算机《从零开始学Hadoop大数据分析(视频教学版)》 一书中第1章,第1.1.5节,作者是温春水 毕洁馨 。

1.1.5  大数据计算模式

  常见的大数据计算模式分为4类,如图1.2所示。

 image.png

图1.2  大数据计算模式

* 批处理计算又称为离线计算,是针对大规模历史数据的批量处理,如MapReduce。

* 流计算是针对流数据的实时计算,可以实时处理产生的数据。商业版的有IBM InfoSphere Streams和IBM StreamBase,开源的有Storm和S4(Simple Scalable Streaming System),还有一部分是企业根据自身需求而定制的,如Dstream(百度)。

* 图计算是针对大规模图结构数据的处理,常用于社交网络,如Pregel、GraphX、Giraph(FaceBook)、PowerGraph和Hama等。

* 查询分析计算是针对大规模数据的存储管理和查询分析,如Hive、Cassandra和Impala等。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。