大数据是什么?【我们都是华为云专家】

举报
菜鸟级攻城狮 发表于 2021/11/10 16:59:21 2021/11/10
【摘要】 随着数字划时代的到来,社会生产生活产生大量的数据,数据量越来越大,种类越来越多、企业迫切对大量数据的背后价值进行挖掘、华为云大数据服务帮助企业构筑从数据接入、存储、计算和分析的全生命周期大数据解决方案,帮助企业客户进一步挖掘数据价值,快速完成数字化转型,激发制造企业的创新活力、发展潜力和转型动力。

目录

1.大数据产生与发展

2.大数据基本概念

3.Hadoop生态系统简介

4.大数据价值与应用

5.大数据发展趋势


大数据产生与发展

大数据是什么内容将包括大数据的产生与发展、大数据的基本概念,还包括生态系统的简介、大数据的价值应用、大数据的发展趋势五个部分。首先,我们来追溯一下大数据的产生与发展。

大数据的产生和发展主要经历了三个阶段

第一个阶段我们称为是萌芽期。自上世纪90年代至本世纪初,随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识的管理技术也开始得到应用,比如数据仓库、专家系统、知识管理系统等等。

第二阶段我们称为是成熟期。本世纪的前十年web2.0应用的迅猛发展,非结构化数据的大量产生使得传统的处理方法已经难以应对,而大数据技术却快速的突破,而大数据的解决方案也逐渐的走向成熟。大数据在成熟期形成了并行计算与分布式系统两大核心技术,谷歌的GFS和Mapreduce等大数据技术也受到了追捧,开源技术hadoop平台也开始大行其道。

而第三个阶段我们称为是大规模的应用期。2010年以后呢,大数据开始广泛用到各行各业,人们开始用数据来驱动决策,社会的信息化,智能化程度也大幅的提高,所以大数据的发展历经萌芽,成熟,再到大规模应用三个阶段。


大数据基本概念

我们了解了大数据的发展历程。那究竟什么是大数据呢?关于大数据的概念众说纷纭,甚至已经成为了一个商业问题,并且在商业出版社被大量的报道。

比如福布斯的杂志报道称,大数据已经抵达seton医疗保健家庭,通过使用这个分析工具,每年超过两百万的复杂病例患者得到了帮助。纽约时报指出,数据已经成为一类新的经济资产,就像货币或者是黄金一样。而cnbc呢也曾这样比喻,数据就像新型石油一样,未挖掘的没有什么价值,但经过加工、提炼以后,将会极大的助力世界发展。

那么我们究竟如何去定义大数据呢?

其实呢到目前为止,大数据还没有一个明确的、统一的定义,不同组织、机构对大数据有着不同的描述。

麦肯锡认为大数据是指大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据集。他认为大数据的一般范围是从几个TB到几个PB,而维基百科给出的定义是无法在一定时间内使用常规的软件工具对其内容进行抓取、管理和处理的大量而复杂的数据集合。美国国家标准技术研究院给出的定义是数量大、获取速度快,或者是形态多样的数据,难以使用传统的关系型数据分析方法进行有效的分析,或者需要大规模的水平扩展才能高效处理的这种数据形态。

Gartaner公司认为大数据是一种体量大、快速和多样化的信息资产,需要使用高效率和创新型的信息技术加以处理,来提高发现、洞察、做出决策和优化流程的能力。可见对大数据的定义还没有统一的定论。但不论哪一种描述,关于大数据的思维特征却是一致公认的。

那什么才是大数据的思维特征呢?

我们来一起认识一下。首先第一个v指的是value容量

主要指非结构化数据的规模和增长速度。因为非结构化数据占数据总量的百分之八十到百分之九十,同时呢也比结构化数据增长快十倍到五十倍,并且数据量是传统数据库的。十倍到五十倍。

第二个v指的是variety。多元化主要指大数据的异构和多样性。

数据有很多不同的形式,比如文本、图像、视频、机器、数据等等,这些数据呢大多是无模式或者是模式不明显。

第三个位置的是value价值,主要体现在大量的不相关信息,价值密度低,需要通过深度复杂分析才可以对未来的趋势和模式进行预测。

第四个位置的是velocity,高效主要体现在实时分析,实时呈现分析结果。

那么接下来我们详细分析一下四维特征。第一个为value数据的体量巨大。主要体现在从TB级别到PB级别,截至目前为止,人类生产的所有印刷材料的数据量是两百个PB。那么当前典型的个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近到EB级别.

这是什么概念呢?我们来看一下容量单位的一些形象示例。比如一个PB等于1024的TB,相当于百分之五十的全美学术研究图书馆藏书的内容总和,一个EB等于1024个PB,那五个硬币就相当于至今全世界人类所讲过的所有话语。一个ZB等于1024个EB,如同全世界海滩上的沙子的数量总和。一个YB等于1024个ZB相当于7000位人类体内的细胞数的总和。可见呢大数据的数据量确实是海量的。

第二个,variety(多样化)。其实物联网数据、互联网数据、企业、行业内的数据呢都是大数据的数据组成部分。那么大数据的多样性主要体现在:


第一、数据的来源多,企业内部多个应用系统的数据。互联网和物联网的兴起带动的微博、社交、网站、传感器等多种数据来源。

第二、数据的种类多。保存在关系型数据库中的结构化数据其实只占少数,而百分之八十到百分之九十的数据是诸如图片、音频、视频、模型、连接、信息、文档等等一些非结构化和。半结构化数据。那么相对以往便于存储的、以文本为主的结构化数据而言呢,这些非结构化数据越来越多,同时这些多类型的数据对数据的处理能力也提出了更高的要求。

第三、关联性强,数据之间的频繁交互。比如游客在旅途中上传的图片和日志,其实呢与游客的位置和行程等信息呢有很强的关联性,因此大数据不仅体现在量的巨大,还体现在种类的丰富多样。

第三个value价值,对于大数据本身而言,它的价值密度低,这是它的典型特征。而如何去挖掘大数据的潜藏价值,像沙粒淘金一样,从海量数据中挖掘稀有并且珍贵的信息才是大数据的核心。

那么第四个v指的是什么呢?第四个velocity(高效)。在大数据领域,能否实现实时的数据流处理,是区别大数据引用和传统数据仓库技术--BI的关键差别之一。那比如我们以一秒为临界点,对于大数据应用而言,要求必须在一秒内形成答案,否则处理结果就是过时或者是无效的。

根据IDC的数字宇宙报告,预计到二零二零年,全球数据的使用量将达到三十五点二个ZB。那么在如此海量的数据面前,处理数据的效率就是企业的生命。以上内容就是大数据的四维特征。


hadoop生态系统简介

面对海量又种类繁多、价值密度低、又需要高效交互的数据需求,如何存储、快速处理,以及从海量数据中提取出高含金量的数据,是大数据分析最核心的内容之一。

而hadoop系统就是这样一套用于大数据处理的分布式架构。好,那么接下来我们来学习一下hadoop生态系统简介。那什么是hadoop呢?hadoop是Apache软件基金会旗下的一个开源的分布式计算平台,为用户提供了系统底层、细节透明的分布式技术架构,它是基于java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中,而hadoop核心是分布式文件系统hdfs和mapreduce。

同时hadoop也被公认为是行业内的大数据的标准开源软件,在分布式系统下提供了海量数据的处理能力,几乎所有的主流厂商都围绕hadoop提供了相关的开发工具、开源软件、商业化工具和技术服务,比如谷歌、雅虎、微软、华为和思科等等。那么hadoop是什么时候诞生的呢?其实hadoop是2004年由Doug cutting提出的,它的原型和灵感来源于谷歌的mapreduce和gfs,它是一套开源的分布式计算框架。后来2006年随着到cutting加入了雅虎,那么hadoop项目也从Nutch项目中独立出。来成为了Apache基金会资助的顶级项目。

随后hadoop经过七年积累,融入了R语言、Hive、pig、zookeeper、cassandra、Chukwa、Sqoop等一系列的数据库及工具,最终从一个科学项目逐渐地发展成为一个成熟的主流商业应用。

这期间一系列将hadoop商业化的软件公司出现了。2015年,华为在开源技术基础上发布了Fusionlnsight企业级的大数据平台,标志着华为正式进军大数据领域。我们了解了hadoop的发展历史。

那么hadoop的架构是怎么样的呢?其实hadoop的架构主要分为系统管理层、数据源层、存储层、处理层和业务应用层。那其中数据来源可以是结构化、非结构化和半结构化的数据,hdfs用作数据存储,一、二平台用于数据处理。那么处理层还包括了MapReduce、Hive、HBase、storm等各种组件。业务应用层面主要包括数据挖掘、统计和分析工具。系统管理层包括了配置、部署、监控、报警、性能容量、分布式协调、高可用、工作流、引擎等等模块,而主要用于维持系统的正常运行。好,以上就是hadoop的架构。

hadoop里包含了许多项目,比如HDFS是hadoop的分布式文件系统,MapReduce是分布式并行编程模型。YARN是资源管理和调度器。TeZ运行在YARN之上的下一代hadoop查询处理框架。Hive是hadoop上的数据仓库,HBase是hadoop上的非关系型分布式数据库。pig是基于hadoop的大规模数据分析平台,提供类似于sql的查询语言Pig Latin。Sqoop用于hadoop与传统数据库之间进行数据传递。Oozie是hadoop上的工作流管理系统,zookeeper提供了分布式协调一致性服务,storm是流计算框架,Flume是一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统。以上呢就是Hadoop系统的主要项目组件。

其实在众多的项目组件中,最著名的是HDFS和MapReduce。

而Hadoop作为一套能以可靠、高效、可伸缩的方式对大量数据进行分布式处理的软件框架,它具有以下几个方面的特性,比如通过多副本机制保证数据的高容错、高可靠性,实现实时数据处理、分析的高效性,可以很容易进行数据节点扩展,从而实现容量扩展的高扩展性,支持通用X86服务器及其他商用服务器的低成本的特征。那么同时Hadoop也支持多种编程语言。以上就是hadoop系统的简介。


大数据的价值与应用

对于大数据而言,它的价值以及应用领域体现在哪里呢?那么接下来我们继续学习大数据的价值与应用。首先我们来看一下大数据的影响。

在思维方式方面,大数据完全颠覆了传统的思维方式,主要体现在三个方面:

第一、全样而非抽样,大数据实现的是全量的数据分析;

第二、效率而非精确大数据,实现高效实施的数据分析;

第三、相关而非因果,大数据分析偏向于分析数据或者是现象的关联性。

在社会发展方面,大数据决策逐渐成为了一种新的决策方式,大数据应用有利的促进了信息技术和各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。

在就业市场方面,大数据的兴起使得数据科学家成为热门职业。而在人才培养方面,大数据的兴起将在很大程度上改变中国高校信息技术相关专业的现有教学和科研体制。

既然大数据对人类的生活产生了如此巨大的影响,那么大数据主要应用在哪些领域呢?

在运营商领域,docomo公司通过撬动大数据,努力开发新的商业机会,提取公司海量的客户信息,实现了8个产业110亿美元的收入。比如基于作物品种和天气的作物种植和收成预测、基于客户位置和行为信息的保险指南,为保险和汽车行业收集并分析驾驶记录,通过实时监控传感器状态、汽车速度、风向、风速等的创新桥梁监控系统,为旅游资源开发汇聚用户的位置信息。

除此之外,docomo公司还根据麦当劳手机用户的消费特征和位置进行一对一的营销。比如日本麦当劳的手机网站拥有超过2600万的会员,而每五个日本人中就有一个是麦当劳移动网站的会员。这些庞大的用户群形成了海量的购买记录数据。docomo通过手机、钱包、读写装置以及后台的CRM系统,成功实现了对大量顾客购买记录数据的积累和分析、处理,从而根据客户各自的消费特征推出了一对一营销的新型优惠券。以上就是大数据在运营商领域的应用。

在公共事业方面,谷歌的流感趋势图通过跟踪搜索词相关数据来判断全美地区的流感情况,政府和医疗机构可以根据相应的分析情况做出相应的对策,以预防流感蔓延。这是大数据在公共事业方面的应用。

在金融行业,大数据的应用也非常广泛。比如伦敦德温特资本市场公司首席执行官保罗霍廷,每天的工作之一就是利用电脑程序分析全球3.4亿微博账户的流言,进而判断民众情绪,再以1到50进行打分。根据打分结果,霍廷再决定如何处理手中数以百万计的股票。霍廷的判断原则很简单。如果所有人似乎都高兴,那就买入,如果说大家的焦虑情绪上升,那就抛售。这一招收效显著,当年第一季度,霍廷的公司就获得了百分之七的收益率。

再比如某银行通过将小微贷客户和非小微贷客户的特征收集,建立小微贷倾向预测模型,其中收集小微贷客户信息10458个,非小微的客户信息1200个,然后将900客户数据执行分析,挖掘出一万四千个客户特征,从而来获取高倾向小微带客户列表,并将前一万名高倾向小微贷客户列表分发给各分行业务部门进行重点营销,最后的执行效果显著,业务的转化率比原有的专业系统提升了二十五倍。

除了金融行业以外,还有教育行业,比如大数据应用分析被应用到美国的公共教育中,成为教学改革的重要力量,包括了学习成绩、入学率、辍学率、升学率等等一些内容的统计、分析和应用。

在零售行业方面,以前某连锁零售企业采取的是人工蹲点的方式进行采样分析,每个潜在新址的店员花费大约几万元。而现在这家连锁零售企业通过大数据分析,根据用户选择的区域,以数据地图的形式展示该区的人群特征和统计报表,为选址提供了依据。此外,零售业通过获取所在区域的人流数据,可以进行人流量和人群特征分析、人群的来访频次和时段的偏好分析。为综合性购物中心、百货、大卖场和专业的连锁客户提供决策辅助。

此外,政府、公共安全和交通领域也有大数据的身影。比如当自动预警与联动系统监控到富华大厦右侧异常人群超过警戒值时,监管部门通过数据分析,及时的定位问题、发送问题,并确认可能是因为群体性的斗殴事件引发了群众聚集、围观,那么此时呢我们可以及时的上报上级的公安部门进行处理。大数据分析还可以实现城市人口的流向监测、分析。由上面所举的例子可见,大数据分析在各行各业都发挥着不可忽视的重要作用。


大数据的发展趋势

大数据的发展有什么趋势呢?顺着这个趋势,大数据的未来又会走向何方呢?对大数据而言,在2011年它还属于新兴技术,2014年已经跨越炒作的顶峰,2015年大数据已经跨越肋骨走向成熟。

如今百分之五十的企业已经投资和使用大数据,而百分之三十三的企业正在规划如何利用大数据。我们看到在大数据领域的持续投资也促使了大数据逐渐的步入到了成熟、发展阶段。而在二零一五年的新技术图中,我们已经找不到了大数据的身影,代表着大数据不再是新兴技术,而已经成为了一种主流技术

而在国家层面上,各国已经将大数据作为国家战略提上了议程。2009年,美国总统奥巴马签署了《透明和开放的政府》。2013年,白宫推出了Data to Knowledge to action计划,这是美国向数字治国、数字经济、数字城市、数字国防转型的一个重要举措。美国政府2016年5月发布了《联邦大数据研究和开发战略计划》,围绕了人类、科学、数据共享、隐私、安全等七个关键领域,部署推进大数据的建设。另外有八国集团在2013年联合发布了G八开放数据宪章,提出要加快推动数据开放和利用。

我国政府对于大数据的发展也极其重视,2015年3月的两会上,李克强总理明确表态,政府应该尽量的公开非涉密的数据,以便利用这些数据更好的服务社会,那么也为政府决策和监管服务。2017年5月28日,在2017中国国际大数据产业博览会上,由大数据战略重点实验室研究、编著、社会科学文献出版社出版的全国首部《大数据蓝皮书中国大数据发展报告No.1》正式发布。

从上面的信息我们可以清晰地看到,全球各主要的经济体都已经将数据开放作为国家战略,促进未来的经济发展。中国在顶层设计上已经开始布局大数据产业。

那么在华为的认知中,什么是大数据呢?

华为眼中的大数据是数据,包括了内部数据、外部数据、多样化数据、海量数据。技术,包括了分布式技术、存储技术、分析技术、挖掘技术和实时技术,更是一种思维,包括了定量思维、跨界思维、相关思维和实验思维。除此之外,大数据还需要传统行业思维方式的转变,要把数据采集、分析作为业务流程的重要组成部分,数据驱动业务流程优化,实现智能化和自动化,并依托数据资产实现跨界拓展。

华为的大数据战略包括了五个维度,

  • 文化维度:自上而下实现决策的数据化
  • 数据维度:让数据在应用中持续流动,贯穿沉淀。
  • 技术维度:建立数据的统一技术大平台,
  • 组织维度:角色清晰、价格明确。
  • 应用维度:服务用户、驱动业务。

整个战略从数据平台到数据分析,再到数据价值,实现应用一体化。


华为云大数据基本介绍

现在我们基本上可以看到整个大在整个IT基础设施里面呢,大数据已经成为了一种基础的IT基础设施了。这个不仅从计算、存储网络可能成为it基础设施,大数据技术,包括我们所我们认为的数据仓库这种技术在各行各业应该都成成为了我们的这个ICT的基础设施。

从我们的这个技术发展的趋势里面我们就可以发现,可能从上个世纪八十年代开始,取源于数据库和数据仓库,特别是数据仓库已经变得非常成熟了,而且数据仓库一直成熟了,到到今天为止可能快四十年了,应用越广,在各个领域、各个行当,它应该来说是不区分任何具体的行业,像什么政府也好、金融也好、公安、互联网等等等等,因为作为一家公司或作为一个组织,你可能肯定要说我每个月要出一次账单、出一次财务报表、每年也要出类似的东西,或者说每个季度也出类似的东西。那么这种出这个账单、财务报表,或者进行一些清算、结算等等这些操作,后台使用的技术应该来说都是这种数据仓库。而且在各行各业的ERP系统里面,或者说其他的系统里面,这个数据仓库用的非常多或者非常广的。当然到了新的世纪,随着这个互联网技术进一步的发展,可能还在我们前面所定义的这种清算领域、结算领域范围的重要作用。当然在一些其他领域,比如说我们刚刚这个这个文字识别或者图像识别领域,那些数据可能都不再是那些结构化的数据,是由于数据库里面产生的非常干净的数据,都是一些文字或者是一些接送的字符串,那么这种情况下可能不再是数据仓库里面的这种,因此就产生了这种大数据的指数。

发展到今天来说,我们可以看到大数据的技术应该发展得越来越成熟、越来越完善。当然现在华为云在这个做大数据这一块,可能主打的就是我们所说我们刚才所提到的基于存算分离加鲲鹏这个完整的解决方案,为我们的用户、为我们的客户提供稳定的、高性价比的这种大数据服务。

我们华为云的大数据整体架构可能总结现在可能就是这个存算分离加鲲鹏总结一句话就是这个存算分离加鲲鹏,它代表什么意思呢?

第一就是我们所有的底层的算力,或者我们所有的芯片是可以支持多种的,一种典型的可能就是这种X86比较传统的,大家可能都在X86的这种芯片上来执行我们的大数据程序,或者来进行我们的进行我们的大数据运算。

同时我们可能提供了第二种选择,这种选择可能会更加高效,同时更加高性价比,就是我们的鲲鹏生态,我们基于我们这种鲲鹏芯片的这种大数据服务,可能相比这种传统的及X86的这种大数据服务,在性能上面,我们的价格可能会低个百分之三十,现在华为的所有的大数据产品,包括我们的什么大数据平台,或者我们的企业级的数据仓库,都是可以在我们鲲鹏上来良好的、运来完整的或者良好来进行运行的。这样从芯片本身,我们可能为我们的客户会带来不小的这种性价比的收益。

第二点就是我们的大数据平台或者我们的大数据服务。相比以往的传统企业级的大数据平台,我们主推的可能这种存算分离的这种方案,就是我们的计算公式和结构的这种计算存储结构可能带来的好处就是我相信大部分的用户,他们数据的增长会远远大于这种计算能力的增长。

我们可能每天要做的要出了报表,或者每个月要出了月报表、月度的清算或者月度的结算,可能大家这些这些运算都是固定的,那但是我的数据会实现哪一些会累积?一年、两年、三年、五年、十年,那么我们的数据会逐步逐步的增大。基于这种情况,我们提供了这种存储跟计算结果,或者存储跟计算分离的这种架构,这很完美的契合我们我们刚才所说的这种情况,就是数据会执行累积,但是计算比较固定,或者说反过来说,如果计算会持续增加,但是数据比较固定也是非常适合这种情况的。我们只要把这两个东西把物理层面上把它给解开,那么我们需要计算的时候就会使用更多的计算资源,或者需要存储的时候就使用更多的存储资源。

避免以往一种情况,就是我不得不因为我的存储量的增加要买服务器,买服务器的时候可能是芯片、cpu、内存、磁盘都可以一起买。我们现在的时候,我们现在在华为云的这种情况,就是我存储增加的时候,我只是买存储就可以了,我计算增加的时候只是买计算就可以了,随时、随地都是按需来进行使用比较方便,同时也比较高效。通过这种方式呢也可以能够结构化的降低我们用户的使用成本。

第三点我们在AI上面有很多的应用或者很多的时间,其实我们AI里面一个重要的时间就是。通过AI的能力、AI的功能能够反向来推动大数据,让我们的大数据算得越来越好,或者算得越来越快、算得越来越稳定。因此我们把很多AI的这种这种能力,保证我们的大数据提取当时的各种特征,来进行优化或者来提升我们大数据的运算能力,最终让用户提得获得一个更加稳定、高效、并且可靠的这个大数据环境或者大数据服务。

我们的大数据平台服务、数据库探索服务、企业级的数据仓库服务,还有智能数据湖运营的DAYU服务,还有一个数据可视化的服务。

下面我们主要介绍一下,大数据的服务比较简单或者说比较通用,我们分分别看一下这些服务能够在哪些场地来进行使用,或者在什么地方可以用得到。

首先这个一站式的大数据平台服务,我们提供了数据端到端生命周期的各式各样的处理部件或者处理能力,从数据接入、数据存储、数据计算、数据分析和挖掘等等等等这整套的。我们OCR之后的数据其实要首先把它存下来,存下来之后可能要做一些汇总、统计、数据、清洗和分析,分析完了之后,我们肯定要需要做一些呈现用的、用的glv等等等等。因此这个大数据平台就是希望能够把以往各式各样的数据,只要我们的数据量比较大。

举个简单的例子,如果我们的数据量可能到了TB级别或者几十TB级别,那么我们需要对这些数据进行处理的话,一般来说可能都都需要这种典型的大数据平台来进行使用,或者来来做一个工具处理我们真正的这这些数据,我们这个纳税平台它的使用场景或者使用的目的可能就在于此,而且这个使用场景和目的啊在我们当前看起来可能是跟行业没什么关系的各行各业,他可能比如说像互联网、iot或者什么政府、金融、公安等等。这些行业他们的数据量其实都非常大,每天要处理的数据可能都按tb这个量级来进行来来进行衡量,可能是几十T或者三百T这种这种量级。对他们来说更加需要这种大数据平台来帮他们把整个数据、把它整理好、运算好,能够给我们的领导、给给我们那个一线运营的人员,或者说给我们用户看到一个良好的结果或者准确的结果,这是我们这个大数据平台他们的定位或者他们的能力是这个样子的。那么其实每家每户可能都有自己的大数据平台,那么华为的大数据平台除了我们最开始所提到的,我们基于存算分离和鲲鹏能够为用户提供一个更具备性价比、同时更稳定、高效的这个大数据平台。

在生态方面,我们的大数据平台是百分之百跟开源接口进行兼容的,开源生态里面能够接入的那些工具、软件或者服务,在我们的华云平台的大数据服务上面都可以都可以继承过来或者都可以接入过来,方便用户能够比较方便或者比较灵活的把我们的大数据平台迁移到华为云上面来。这是我们自己梳理了一下,我们的大数据平台或者我们的MRS服务比较适用的这些场景。但现在我们看到这个一站式的大数据平台,它只要满足一个条件就基本上比较实用,就是我们做的只要能够产生大量的数据,而且这个数据可能占TB级别或者更大的这个重量维度来来看的话,超过了TB,几十TB、上百TB或者TB级别的话,那么他们一般来说这些行业不得不使用这种大数据平台来对我们的数据进行一些清晰转换的话,能够出一些汇总统计。同时还有一部分用户可能会将来做一些类似用户画像、精准营销等等这方面的操作,来为我们的业务产生更多的价值。数据能够通过大数据平台产生价值,为上层的业务服务。



比如在哪些行业可能有什么东西、有什么样的使用方式呢?下面我们介绍个例子,一个例子是比较典型的iot的例子,就是我们有一个客户,他们以前可能在线下的adc里面自己搭搭建了一套这个车联网的这个车联网的平台,当然主要使用了一些开源的这种大数据大数据平台搭建的,他们把在基于新兴idc搭建的这个平台啊统一搬到了华为上,我们搬迁过程基本上实现了这个百分之百的接口兼容,就是他们的代码基本一行没改。他们以前的所有写的那些应用都可以在华为云上直接来进行使用或来进行迁移。同时呢在接口、代码一旦不改的情况下,我们我们的平台的专项的调优,能够让他跑运行过程中性能更加好、更加方便,而且运维也更加更加顺畅一点。毕竟以前可能基于开源搭建的出问题的话,可能还要到开源社区去反馈、去求助。现在使用云服务的话,可能在这方面可能就不再需要了。总体来说,使用这个云上面的云服务,能够在对他们的业务、人员没产生任何影响的情况下,可能带来额外的收益或者更更多、更大的收益,就是在整个车联网领域。

总结:

随着数字划时代的到来,社会生产生活产生大量的数据,数据量越来越大,种类越来越多、企业迫切对大量数据的背后价值进行挖掘、华为云大数据服务帮助企业构筑从数据接入、存储、计算和分析的全生命周期大数据解决方案,帮助企业客户进一步挖掘数据价值,快速完成数字化转型,激发制造企业的创新活力、发展潜力和转型动力。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。