图数据库市场格局 :「一起学图数据库」系列第3篇

举报
且听风吟 发表于 2019/11/10 10:55:25 2019/11/10
【摘要】 「一起学图数据库」系列文章图数据库概述图数据库与传统数据库的对比分析本文主要包含如下两部分内容:1. 图数据库的技术优势。2. 市场主流图数据库技术。以下是正文内容:据数据库咨询公司DBEngines.com称,图数据库是所有数据管理系统中成长最快的分类。 由于很早就已经被Twitter,Facebook和Google等公司采用,图数据库技术已经演变成当今各行各业所使用的主流技术。那么,图数...

「一起学图数据库」系列文章


图数据库概述

图数据库与传统数据库的对比分析


本文主要包含如下两部分内容:

1. 图数据库的技术优势。

2. 市场主流图数据库技术。


以下是正文内容:

据数据库咨询公司DBEngines.com称,图数据库是所有数据管理系统中成长最快的分类。 由于很早就已经被Twitter,Facebook和Google等公司采用,图数据库技术已经演变成当今各行各业所使用的主流技术。


640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1


那么,图数据库为何如此受欢迎呢? 基于顶点,边和属性的数据模型,图数据库克服了其他数据库无法解决的大而复杂的数据难题。与传统的RDBMS和新的大数据产品相比,图数据库有着明显的优势。

 

图数据库主要优点



更好、更快速的查询和分析能力:图数据库为海量图数据查询提供了卓越的性能。 图模型提供了固有的索引数据结构,因此它不需要为给定条件的查询加载或接触不相关的数据,这使得它成为更好、更快的实时大数据分析查询的绝佳解决方案。这与Hadoop HDFS之类的系统非常不同,HDFS主要是为Data Lake、顺序扫描以及支持在已有数据基础上追加新数据等场景而设计的。在这样的系统中,很多查询都涉及文件的大部分数据。使用图数据库,查询只需要触及相关的数据。


更简单和更自然的数据建模:使用关系型数据库建模的人都需要了解数据库的范式和参照完整性的严格规则。某些NoSQL数据库则走向了另一个极端,将所有类型的数据放在一个大数据表中。另一方面,在图数据库中,可以定义任意类型的顶点类型来表示对象,并定义边类型来表示特定的关系。图模型的语义和你期望的语义完全一致,没有过多的冗余。 此外,图模型支持面向对象的思维,显然,所支持的每一种查询也都必须要有明确的语义,不像SQL中需要了解一些隐含的规则或假设。


同时支持实时更新和查询:图数据库支持对大图形数据的实时更新,同时支持查询。


数据结构的灵活性:图数据库具有灵活的Schema修改能力。用户可以不断添加或删除新的顶点、边和属性,扩展或缩小数据模型。 这对管理不断变化的对象类型特别方便。大多数图数据库可以支持在线修改Schema,同时继续提供查询。相比之下,关系数据库不能轻易地支持在现代数据管理时代如此普遍的频繁Schema变更。

 

市场格局



随着图形数据库的普及,我们看到了新兴市场的不断涌现,创造了包含相关工具和技术的良好市场格局。让我们简单看一下图数据库市场中的有哪些典型的技术。

 

Operational Graph Databases


Gartner将Operational Databases定义为(Gartner Inc., Magic Quadrant for Operational Database Management Systems, published: October 2016, ID: G00293203)


Relational and non-relational DBMS products suitable for a broad range of enterprise-level transactional applications, and DBMS products supporting interactions and observations as alternative types of transactions


Bloor Research称,这些图数据库的解决方案往往基于本地图形存储或者建立在NoSQL平台之上。他们专注于提供事务(ACID)和处理分析能力,对索引没有绝对的要求 (Bloor Research: Graph and RDF databases 2015 #2, published Sept. 2015)


Operational Graph Database包括:Titan,JanusGraph,OrientDB和Neo4j。

 

Knowledge Graph / RDF


资源描述框架(RDF,有时称为三元组)是一个万维网联盟规范的家族,最初是作为元数据模型设计的。它已经被用作概念描述或在网络资源中实现的信息建模的一般方法,使用各种语法记号和数据序列化格式。


根据Bloor Research的研究,这些图往往语义集中,基于一些成熟的数据库技术构建(包括关系型数据库)。 它们非常适合在操作环境中使用,但具有推理功能,即使在事务环境中也需要索引能力(Bloor Research: Graph and RDF databases 2015 #2, published Sept. 2015)


许多图数据库是基于RDF实现的,包括:AllegroGraph,Virtuoso,Blazegraph和Stardog。

 

Multi-Modal Graphs


该类别主要指支持多种数据模型的数据库。 例如,常见的可能性是文件存储、键值存储、对象存储或者RDF/图形存储的三路选项 (Bloor Research: Graph and RDF databases 2016, published Jan. 2017) 。多模存储的优点是可以针对相同的数据运行不同类型的查询,例如图形查询和键值查询。主要缺点是性能无法与专用和特殊优化的的数据库管理系统相媲美。


Multi-Model Graph Database包括:Microsoft Azure Cosmos DB,ArangoDB和Sqrrl。

 

Analytic Graphs

Bloor Research介绍说,分析图侧重于解决 ‘known knowns’ 问题。在知道实体和关系的情况下,或者‘known unknowns’ 甚至 ‘unknown unknowns’ 问题。分析图包含不同的体系结构,包括本地和非本地存储,并行化的不同方法以及高级代数的使用。(Bloor Research: Graph and RDF databases 2015 #2, published Sept. 2015)


Analytic Graphs包括:Apache Giraph和Turi(以前称为GraphLab,现在归Apple公司所有)。

 

Real-Time Big Graphs


实时大图是一种新的图数据库类别,用于处理海量图数据,支持海量图数据实时更新能力并提供实时分析能力。Real-time Big Graphs能够支持单Server 100M+每秒的事务处理能力或数据更新能力。为了处理大型和不断增长的数据集,实时大图数据库被设计成可横向扩展和纵向扩展。


TigerGraph属于Real-Time Big Graphs。

 

总之,现在有许多不同类型的图形数据库产品可供选择,并且每种产品都有其独特的优势,这就是为什么了解图形数据库在各个垂直行业和用例中继续被采用的差异是很重要的。根据Forrester Research最近的一项调查,“全球数据和分析技术决策者中有51%正在实施,已经实施或正在升级他们的图数据库系统”(Forrester Research, Forrester Vendor Landscape: Graph Databases, Yuhanna, 6 Oct. 2017)。


本文转载自微信公众号【Nosql漫谈】。

原文链接:https://mp.weixin.qq.com/s/-d4ryL4maN8O6Ahinq5L6g

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。