知识图谱系列(二)图谱在行业中的应用

举报
Cheri Chen 发表于 2021/01/21 11:16:41 2021/01/21
【摘要】 知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的大规模语义网络,帮助机器实现理解、解释和推理的能力,是认知智能的底层支撑。本文从介绍了知识图谱技术在各行业中的代表性应用场景。

1. 知识图谱的典型应用

1.2 原图应用

知识图谱是人工智能应用链条的第一步,是人工智能的底层技术。知识图谱在高效数据处理和知识加工推理方面的能力,可以推动人工智能既有产品的升级或提供更有效的解决方案,同时也可以转化为新的商业产品形式。

知识图谱的产品形式可以分为原图应用和算法支撑两类。原图应用指基于知识图谱的图结构和丰富的语义关系,直接通过图谱产生价值的服务形式,例如图挖掘、关联分析等。通用知识图谱被视为下一代搜索引擎的核心技术,而行业知识图谱由于有具体场景的认知深度,能很好地满足垂直领域知识类查询的需求,如企业业务流程查询、司法领域案例查询等。算法支撑指通过知识图谱对于信息源的数据进行处理,将产出的结构化关联数据用于其他人工智能任务的算法模型训练和应用中,得到能解决具体场景问题的研判建议,形成解决办法产生价值的服务形式。

03.JPG

1.2 算法支撑:支撑其他人工智能任务:搜索、问答、推荐

知识图谱为其他人工智能任务提供算法支撑的典型应用主要包括智能问答、智能搜索和智能推荐、决策分析系统等,目前都已产生了成熟且广泛应用的商业产品,同时也是各领域知识图谱中的重要一环。基于知识图谱的智能搜索能对文本、图片、视频等复杂多元对象进行跨媒体搜索,也能实现篇章级、段落级、语句级的多粒度搜索。智能搜索让计算机更准确地识别和理解用户深层的搜索意图和需求,在知识图谱中查找出目标实体及其相关内容,对结果内容进行实体排序和分类,并以符合人类习惯的自然语言的形式展示,从而提高搜索体验。智能问答可以分为直接回答、统计回答和推理回答。基于知识图谱的智能问答能从实体和短句两个维度进行挖掘,能理解多样问法和有噪音问法,具有较高的准确率、召回率。在对话结构和流程设计上,能实现实体间上下文会话的识别与推理,最终实现更自然的人机交互。基于知识图谱的智能推荐则通过获得用户和物品的精确画像,从而实现准确的匹配和有针对性的推荐,实现场景化、任务型的推荐。


2.  知识图谱在各领域中的应用概览

数据繁杂、单一价值有限、问题抽象需要可视化展现、五层关联维度以上的应用场景更加适合搭建知识图谱

应用场景

3.  知识图谱在行业中的应用


3.1 城市治理知识图谱应用场景

知识图谱赋能城市智能公共管理系统,打造城市“数字大脑”

中国城市存在巨大的存量治理和精细化发展需求。随着城市公共管理的数据来源由政务数据不断拓展至交通、视频、环境等其他城市运行感知数据以及企业数据,城市大数据平台也从政务共享交换平台,发展成为多方共建共用共享的大数据平台。基于知识图谱技术,将分散在政府各个部门、生产生活各个领域的相互孤立的数据资源联通共享,实现多源数据集成交换,从而对政务数据和社会数据进行深度挖掘。通过数据融合分析与管控,最大化发挥数据要素的效能,发现不同群体、不同行业的服务需求,实现政务服务的精准化供给、政府科学决策和高效社会治理。

3.2 公安知识图谱应用场景


重点解决数据关联性和数据价值挖掘问题,赋能线索情报分析与案件预警

公安大数据是全面助推公安工作质量、效率、动力变革的重要力量。随着跨部门、警种、业务的协同和整合大趋势的到来,知识图谱能通过数据分析、文本语义分析等手段,抽取出人、物、地、机构、虚拟身份等实体,并根据其中的属性、时空、语义、特征、位置联系等建立相互关联,构建一张多维多层的,实体与实体、实体与事件的关系网络。在解决公安大数据发展中面临的数据缺乏关联性、缺乏全警种智能应用等问题时发挥重要作用,真正激发大数据的价值。

建设公安知识图谱仍遵循知识图谱搭建逻辑,但其中知识抽取、本体层建设和实战应用开发等环节需要运用分布式储存、关联算法、语义推理等技术,将公安部门多年业务中积累的技战法进行总结和可视化处理,与技术算法相互转换,以集成犯罪和预测模型,实现重点人员场所关联分析、物品关联分析、团伙关系分析、异常事件挖掘、相似案件推理等功能,提升公安信息化的智能化水平,促进公安情报研判的演进,高效服务公安的打防管控工作,甚至做到精准的犯罪预测预警。

3.3 医疗健康知识图谱应用场景


在就医导诊、辅助诊断、药企市场拓展等领域提供知识服务

医疗健康是典型的数据海量且多源异构的行业,且限于数据专业性强、结构复杂,数据融合在医疗健康行业应用场景中更加困难。利用知识图谱的能力,可以聚合核心医学概念和全方位的医疗生态圈知识,从海量的临床案例中对经验和知识进行提炼整理、录入标注、体系构建,在解决优质医疗资源供给不足和医疗服务需求持续增加的矛盾中产生重要的作用。

3.4 教育知识图谱应用场景


教育知识图谱与机器学习算法结合实现智适应教育

当前人工智能技术更多应用在如拍照搜题、口语评测、课堂监控等外围需求的工具上,并未能有效深入到教学场景中,而真正产生生产价值建立在充分且必要的数据基础上,搭建贯穿教材知识体系、教学资源管理和受教育者学习轨迹的知识图谱,将教与学的全过程进行可视化展现,使静态知识点数据与动态教学活动的数据产生关联,为算法利用提供支撑环境。

知识图谱在教育领域主要有以下几种应用场景:一是将学科教材知识进行本体建模,形成可关联性查询的知识网络;二是以图结构将教学资源以及关系进行语义化组织,以便合理调用;三是在知识图谱的基础上,应用大数据、AI等技术形成面向学习目标的个性化学习路径,实现千人千面的教学方案;四是面对受教育者搭建个人知识图谱,通过对其知识点学习进度和考试反馈数据的实时关联,形成知识掌握状态的可视化个人画像,以至于习题推送和老师一对一教学有的放矢;五是将教育领域碎片化多源异构数据进行处理,形成标准化的关联数据集,为机器学习算法训练提供充要条件。

通过以上五点应用,勾勒出基于知识图谱的数字中台形式,最大限度地对教育领域数据进行资源整合,为上层智能化应用提供支撑,改变了“传统教育披上人工智能外衣”的状况,用技术起底教育逻辑,形成数据指导下自适应学习的价值闭环。


3.5 通用制造业知识图谱应用场景

对基础数据进行建模,在制造全流程实现多方面协调管控

制造业体系庞大、场景丰富、产品类型多、定制化程度高,具有数据庞大且知识结构复杂的特性,存在着如工序流程和工艺制造知识等事理知识,同时也存在大量的定量知识。事件之间存在着大量的事理逻辑关系,而不同角色本体构造提出的需求也不尽相同。引入知识图谱技术,将工厂车间、人工资源、物料组件、设备制具、工艺流程、故障等制造业的基础数据进行知识分类和建模,通过对知识的抽取,对定量知识与事理知识的融合以及对实体之间复杂关系的挖掘,构建制造业知识服务平台,建立产品规划、设计、生产、试制、量产、使用、服务、营销和企业管理等全生命周期的互联,还能融合环境、焚烧、水务、模具、能源管理等多个相关行业的知识内容,通过快速搜索和推理关系中的趋势、异常和共性更好地组织、管理和理解制造业体系的内部联系,将知识转化为决策依据,破除产品封闭式的重复研发实现创新,进行全流程多方面的协调管控,提高制造流程中问题的预见和解决能力,提升资源管理能力、生产效率和产品质量。


3.6 智慧建筑知识图谱应用场景

集合构建以BIM数据与规范为主的建筑工程行业知识图谱

当前建筑行业仍是劳动力密集型行业,拥有动态且复杂的行业结构。根据不同项目类型、项目阶段和项目目标,将项目过程中不断重复的知识、使用知识本体的方式进行组织化的设计和管理,以实现从图纸设计、审图、施工、验收到楼宇运维全流程内知识的重复使用和组织化管理,是建筑行业实现智能化的目标。当前建筑信息模型(BIM, BuildingInformation Modelling)从工程实践到管理理念上都在给建筑业与施工业带来不同程度的变革。作为含有丰富语义信息的三维模型载体,BIM的属性与信息体系包含了建筑的空间几何信息、属性信息等,是实体建筑的数字化表达,具有真实性和全面性的特点都可以有效分类和聚集成为若干知识本体,结合知识图谱的知识抽取、知识融合及知识加工等构建技术,集合成以BIM数据与规范为主的建筑工程行业知识图谱,从而提升设计阶段BIM审图规范与效率、辅助施工阶段质量管理与决策、改善运维阶段数据流转与分析能力。


3.7 智能风控与信用评估

知识图谱与机器学习相结合,重塑金融领域智能风控过程

无论是传统金融或是互联网金融领域,信用评估、反欺诈和风险控制都是最为关键的环节,随着近些年金融数据的爆发式增长,传统风控系统逐渐力有不逮,而应用机器学习算法和知识图谱的智能风控系统在风险识别能力和大规模运算方面具有突出优势,逐渐成为金融领域风控反欺诈的主要手段。机器学习和知识图谱相结合是目前主流的解决方案。

机器学习算法通过概率计算的方式,以数学运算特征反应风险情况,形成易于机器计算的风控模型;而知识图谱通过权威经验和规则创建本体模型和抽取实体的范围,根据实体间关系形成关联数据网的图谱形式,打通相关数据,动态、实时地描画囊括个人基础信息、金融行为、社交网络行为等用户综合画像,并结合业务场景,根据画像的情况与模型对应,形成具有金融业务特性的风控体系,在解决方案的决策环节结合规则和概率的综合评价,给出最终的风险评估,整个过程能够实现秒级响应。知识图谱的应用不仅能够为缺乏可解释性的机器学习算法带来必要的参考系,还可以串联金融业务中产生的大量多源异构数据形成知识库或知识中台,挖掘数据深层价值,为实现标签体系构建、投资关系梳理、产业链风险预警、智能催收等上层应用打下基础。


3.8 智能投资研究顾问

通过自动抓取和产业链关系推理解决投研领域痛点

对一级或二级市场的投资研究,一直是泛金融领域重要的课题,上市公司或一些重要的标的公司在公开网络中披露了众多如财务数据、定期公告、公司研报等有价值的信息,为投资者行为提供了充分的参考依据。传统投研工作需要分析师通过各种渠道搜集和判别信息,凭借个人经验对零散的数据进行组织建模,以报告的形式产出趋势观点和数据分析,大部分的物料和时间成本都花费在信息和数据的搜集上,加之金融资讯信息时效性极强,成果可控性不高,纵使头部金融数据机构提供了相应的软件产品,但数据的颗粒度和产业链关联性仍难以满足多元需求。此外,金融行业人才流动快,专精于某一领域的分析师一旦离职,将直接影响这个行业分析的延续。

利用NLP技术自动抓取关键信息,搭建投研领域知识图谱,能减少基础数据处理的工作,将各个行业的发展变化抽象导入数字层面,为知识查询和应用开发提供实现基础。由于券商研报中80%的数据指标在传统软件产品中无法被查询,分析师在进入一个新领域时要耗费大量时间搜集类似数据,知识图谱投研产品可以大大缩短这一必要劳动时间,大幅提高投研效率。除静态领域图谱外,基于时间序列还能搭建对网络报道、新闻事件进行抓取的事理图谱,两相结合,从行业固有逻辑和实时信息双管齐下,推导事情的发展脉络和趋势走向,梳理关联脉络,为后续判断投资机会等研判类应用提供数据支撑。

转载引用:2020年面向人工智能新基建的知识图谱行业白皮书


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。