知识图谱术语定义搜集与斟酌
知识图谱(Knowledge Graph)
WikiPedia的定义:在知识表示和推理中,知识图谱是使用图结构的数据模型或拓扑来集成数据的知识库。知识图谱通常用于存储具有自由形式语义的实体(对象、事件、情况或抽象概念)的相互关联描述。
网上看到的一种定义:
知识图谱是由本体(Ontology)作为Schema层,和RDF数据模型兼容的结构化数据集。(从形式出发作出的定义)
个人比较认可的定义:描述真实世界中存在的各种事物的自身性质和事物之间联系的语义网络。(从作用出发作出的定义)
理由:大家都知道知识图谱本质上是一种语义网络,其脱胎于语义网络,是语义网络的一个子集,那么其不同于其他语义网络的关键就在于它的用途和作用。最初Google提出知识图谱是为了更好的理解用户输入的文本背后的含义,这就是知识图谱最大的作用:建立起文字与真实世界的事物的联系,发现文字中指代事物的背后性质与联系。就图谱本身来说,人只要看到其中的节点和边就能立刻知道它是什么;就图谱与文字的关系来说,二者能够通过真实世界这样一个桥梁联系起来,从而能作为理解人类语言背后指代的事物和事物性质与联系的工具;就图谱与机器的关系来说,计算机利用结构化图谱数据的效率远远高于利用人类自然语言,图谱也就成为了人类和机器指代各种事物的媒介。这些都是知识图谱与一般语义网络不同的地方所在,即它是用来描述真实世界中的事物的,其中的节点和关系都能够在真实世界中找到对应的事物与事物之间的联系。
语义网络(Semantic Network)
WikiPedia的定义:
语义网络(英语:Semantic Network)是表示网络中概念之间语义关系的知识库,常常用作知识表示的一种形式。它其实是一种有向图;其中,顶点代表的是概念,而边则表示的是这些概念之间的语义关系。
网上看到的定义
一种以有向图的形态表示人类知识的形式,在一个语义网络中,信息被表达为一组结点(顶点),结点通过一组带标记的有向直线彼此相连,用于表示结点间的关系(边)。
另一种网上看到的定义:
语义网络是由Quillian于上世纪60年代提出的知识表达模式,其用相互连接的节点和边来表示知识。节点表示对象、概念,边表示节点之间的关系。
需要与之区分开来的另一个概念叫语义网(Semantic Web),它在WikiPedia上面的定义:由万维网联盟的蒂姆·伯纳斯-李(Tim Berners-Lee)在1998年提出的一个概念,它的核心是:通过给万维网上的文档(如: HTML文档)添加能够被计算机所理解的语义(元数据),从而使整个互联网成为一个通用的信息交换介质。语义万维网通过使用标准、置标语言和相关的处理工具来扩展万维网的能力。不过语意网概念实际上是基于很多已有技术的,也依赖于后来和text-and-markup与知识表现的综合。“语义”网是由比现今成熟的网际搜索工具更加行之有效的、更加广泛意义的并且自动聚集和搜集信息的文档组成的。其最基本的元素就是语义链接。
说明:
- 知识图谱、语义网络、语义网三者之间的关系:知识图谱是语义网络的一个子集,语义网是语义网络的一个实现;
- 知识图谱与语义网络形式上最大的区别:语义网络的节点和边的值没有标准,不区分概念节点和对象节点,;知识图谱有一套不断完善的标准(RDF/RDFS/OWL等)给概念、实体、关系作出限定,使用本体层存放概念节点、数据层存放对象节点。
本体(ontology)
WikiPedia的定义:
本体论(英语:Ontology),是研究诸如生存、存在、成为和现实之类的概念的哲学分支。它包括以下问题:如何将实体分为基本类别,以及哪些实体存在于最基本的层次上。本体论有时被称为存在的科学,并且属于被称为形而上学的哲学的主要分支。
网上看到的一个定义:
本体本身是个哲学名词。在上个世纪80年代,人工智能研究人员将这一概念引入了计算机领域。Tom Gruber把本体定义为“概念和关系的形式化描述”。通俗点讲,本体相似于数据库中的Schema,主要用来定义类和关系,以及类层次和关系层次等。OWL是最常用的本体描述语言。本体通常被用来为知识图谱定义Schema。
另一种网上看到的定义:
本体(ontology)是对概念进行建模的规范,是描述客观世界的抽象模型,以形式化的方式对概念及其之间的联系给出明确定义。
本体(ontology):对特定领域之中某套概念及其相互之间关系的形式化表达,知识图谱的本体可以理解为知识图谱的数据模式,通常也可以描述为一个语义网络,描述了知识图谱中有哪些类型的实体(实体类),每个类型的实体有哪些类型的属性(属性类),各类实体之间有哪些类型的关系(关系类)。
知识图谱中的元素
-
实体(entity):指具有可区别性且独立存在的某种事物,是知识图谱的最基本元素,在知识图谱中表现为语义网络中的顶点。
-
属性(attribute):指描述事物自身性质或者事物间联系的性质的信息,在知识图谱中表现为实体的键值对数据(属性名和属性值)。
-
关系(relation):指事物之间普遍存在的联系,在知识图谱中就是描述实体之间联系的语义边。
-
概念(concept):具有同种特性的事物构成集合的名称,一般指集合、类别、对象类型、事物的种类等。在知识图谱中一般表示为本体中的元素,与上面知识图谱中的元素对应,可以分为以下几类:
- 实体类(实体概念),具有同种特性的实体构成的集合;
- 属性类(属性概念),同类实体拥有的自身性质的概念描述;
- 关系类(关系概念),各类实体之间存在关系的概念描述。
- 点赞
- 收藏
- 关注作者
评论(0)