OBS大数据解决方案开篇

举报
万广平 发表于 2020/08/08 16:11:47 2020/08/08
【摘要】 随着企业数据资产的增加,如何能可靠安全的存储这些数据,以及如何能高效处理这些数据成为了大数据技术的起点,以hadoop为代表的开源技术大肆兴起,随后大数据技术栈如雨后春笋般的涌现,hive,spark,impala,presto,flink。。。几乎每隔一两年就会有新的大数据处理框架出现,同时也出现了HDP,CDH,FusionInsight等整体解决方案,而随着云计算的发展和各企业...

    随着企业数据资产的增加,如何能可靠安全的存储这些数据,以及如何能高效处理这些数据成为了大数据技术的起点,以hadoop为代表的开源技术大肆兴起,随后大数据技术栈如雨后春笋般的涌现,hive,spark,impala,presto,flink。。。几乎每隔一两年就会有新的大数据处理框架出现,同时也出现了HDP,CDH,FusionInsight等整体解决方案,而随着云计算的发展和各企业的接收程度,大数据领域也在积极拥抱云计算,各个云计算厂商都推出了托管式的大数据整体解决方案,例如华为云的MRS+OBS,aws的EMR+S3。。。

    在大数据整体技术架构中,分布式文件系统和对象存储系统成为了主流的数据存储解决方案,hadoop的HDFS协议和aws的S3协议成为了事实上的数据访问标准,其上层的计算框架和周边生态均实现了通过HDFS协议和S3协议访问数据的能力。华为云OBS作为大数据解决方案中的数据存储层,其实现了HDFS协议并且兼容S3协议,从而降低了数据访问和迁移成本。

    后续的系列博客将重点讲述各个大数据技术栈和OBS的整合,包括

hive

spark

flink

presto

impala

druid

flume:https://bbs.huaweicloud.com/blogs/193528

sqoop

dataX

hbase

solr


【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。