知识图谱系列(三)知识图谱擅长的方向
现有的知识系统在知识挖掘能力上存在很大的缺陷。系统里的数据类型单一且割裂,知识查询性能差,相关的算法扩展能力也不足。知识图谱作为人类对世界认识的数字化、系统化和结构化的体现,能够很好得辅助机器进行语义的理解和语言的生成。基于图谱图的性质和三元组的统计特性,知识图谱在辅助智能问答、自然语言理解、大数据分析、推荐计算等多方面展出独有的优势。
1.1 智能推理
-
面向知识图谱的推理主要围绕关系的推理展开,即基于图谱中已有的事实或关系推断出未知的事实或关系 ,一般着重考察实体、关系和图谱结构三个方面的特征信息。图数据相对于传统的关系型数据具有更强大的表达能力,善于处理大量的、复杂的、互联的、多变的网状数据。通过利用知识图谱中实体、概念和关系来解释现实世界中的事物和现象,使机器能解释现象。更进一步的,基于知识图谱和逻辑规则或统计规律,机器能推理出实体或概念间深层的、隐含的关系,实现认知智能的“推理”能力。
对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在右侧已有的知识图谱中查询答案。例如图中人物主题的知识图谱,可以通过姚明和叶莉的关系来回答用户提出的自然语言问题:姚明的老婆的国籍是?
1.2 智能搜索
- 传统搜索引擎依赖网页之间的超链接实现网络的搜索,知识图谱和语义技术提供了事物的分类、属性和关系描述,使得搜索引擎可以直接对事物进行搜索。基于知识图谱的智能搜索能对文本、图片、视频、音频、loT等各种信息资源进行跨媒体搜索,也能实现篇章级、段落级、语句级的多粒度搜索。智能搜索通过在知识图谱中查找出目标实体,并根据实体在知识图谱网络结构中的重要性、实体流行度及查询相关性对结果内容进行实体排序和分类,可有效提高搜索体验,同时也提供了可解释性的依据。基于图谱的搜索还可以拓展目标实体之外的相关内容,并向用户有效得呈现相关实体,提升搜索多样性,让计算机更准确地识别和理解用户深层的搜索意图和需求。
知识图谱技术以多种途径被用来增强关键词搜索,以此来改善搜索的查全率和查准率。例如在搜索引擎中搜“西红柿”,可以检索到“番茄”的相关结果以及和番茄相关的知识内容。
1.3 智能问答
-
利用搜索引擎的问答体验只能返回相关文档集合,无法获得精确信息,而传统的问答和对话系统大多只能回答事实性问题,不能很好得处理复杂问题。基于知识图谱的问答通过对问题进行语义解析,将自然语言问题中的实体描述和关系描述分别链接到知识图谱中的实体和关系,能理解多样问法和有噪音问法,具有较高的准确率、召回率。在对话结构和流程设计上,大体量、高质量的知识图谱为问题的语义理解提供了丰富的背景知识,能实现实体间上下文会话的识别与推理,实现更自然的人机交互。
以知识图谱为中心,通过实体识别与链接技术把各类可以作为对话的数据源融合在一起,实现跨领域、跨交互形式的多轮对话。图中例子涉及很多跟音乐相关的知识。交互形式有聊天、问答、操控、主动对话,是通过知识图谱中实体间的关联,将这些知识关联在一起,形成一个流畅的对话。
1.4 智能推荐
- 知识图谱的本质是一个存储实体之间关系的结构化网络,蕴含了推荐系统中对于目标事物的大量背景信息,以及事物之间的关系。知识图谱为推荐提供了目标事物的精确画像,例如用户行为、兴趣、需求等信息,从而实现准确的匹配和有针对性的推荐,实现场景化、任务型的个性化推荐。此外,知识图谱作为混合推荐系统中一类有效的辅助信息,有效地解决推荐系统中存在的一系列关键问题, 例如数据稀疏、冷启动、推荐多样性等。
例子中,知识图谱提供了不同的关系链接种类,为物品引入了更多的语义关系,有利于推荐结果的发散,避免推荐的局限性,能够更深层次地发现了用户的兴趣。该用户很有可能也喜欢《阿甘正传》《末代皇帝》、《搜索》等。同时,图谱可以连接用户的历史记录和推荐结果,提高用户对推荐结果的满意度和接受度,增强用户对推荐系统的信任。
1.5 大数据分析
-
知识图谱基于本体融合和多种来源的数据集成,增强了数据之间的关联,使得用户可以用更加直观的图谱方式对数据进行关联挖掘和分析。知识图谱以图数据库作为存储引擎,善于处理大量的、复杂的、互联的、多变的网状数据,其效率远远高于传统的关系型数据库。图数据擅长的数据挖掘如节点聚类、链接预测、子图挖掘等,知识图谱都能够继承,且可以利用独有的语义关系进行补充分析。
图上的语义搜索是一种新型的图计算应用方向。例子中通过构建图片中的事物语义关系网络,可以快速搜索到符合场景、描述的相关图片。
- 点赞
- 收藏
- 关注作者
评论(0)