深源恒际与医倍思特达成合作 医疗票据OCR助力车险人伤理赔智能化
近期,AI科技公司深源恒际与智能人伤理赔平台医倍思特就医疗票据智能识别达成合作。
医倍思特是知名信息技术服务商精友旗下的智能人伤理赔平台,基于云计算、大数据和人工智能等前沿技术,依托标准的医疗数据库、规范的业务流程管理,整合医疗数据管理、人伤业务流程管理、风险规则管控、统计分析报表、数据对接等核心功能,提供车险人伤理赔业务全流程智能化解决方案。
鉴于当下医疗信息数据暂未实现跨区域、跨层级、跨部门的联通与共享,保险机构在处理理赔案件时无法直接调用出险人的医疗信息。以医倍思特为例,作为智能人伤理赔平台,在处理涉及人伤的车险理赔案件时,平台需要出险人提供住院病历、诊断证明、医疗发票、费用清单、出院小结等一系列相关材料作为理算依据。收到证明材料后,医倍思特平台需要投入专业人力资源完成信息采录,只有信息录入理算系统,才能得出理算结果、完成相应理赔。
鉴于此,深源恒际基于计算机视觉技术,为医倍思特研发了医疗票据智能识别与结构化提取解决方案。基于OCR识别技术,结合专项训练+自适应提取方法,自动从住院病历、诊断证明、医疗发票、费用清单、出院小结等各类医疗票据中识别、提取出理算所需的字段信息,帮助医倍思特实现信息采录数字化,提升平台核赔理算效率,实现服务优化升级。
实际落地中存在诸多需要突破的技术难点。比如,票面信息模糊、发票折叠畸变、内容重叠、信息串行等都会对影响识别准确率。为降低或消弭噪音,深源恒际在训练算法模型时结合多种图像处理技术排除干扰,增强算法模型的鲁棒性和抗干扰能力。
首先,医疗票据在全国范围内没有统一模板,各地式样五花八门,通用OCR算法识别稳定性差,无法满足业务需求。
深源恒际采用针对性强化法在模型训练中增强特征提取细粒度,依据各地不同模版的启发性信息辅助文字区域的定位和切分,弱化式样差异带来的不良影响。目前,已完成针对性强化训练的模型包括北京、天津、上海、浙江、山东、广东、江苏、河南、湖北九地及部队医疗系统模版。
其次,各地医疗票据多采用数据与格式分离的套打方式,在OCR识别中会带来两方面困扰:一是套打发票大多采用针式打印技术,图像分辨率低、打印字迹模糊,影响识别准确率;二是机打信息与印刷信息容易套打错位,造成内容重叠或串行——重叠时信息被覆盖或遮挡,这在文本检测中易被漏检,在文本识别中易被误识,而串行则增加了信息提取难度,影响数据结构化。
深源恒际基于深度学习算法,通过图层分离技术突破了套打方式带来的技术难题,使识别准确率大幅提升。
图层分离:基于大量数据分析,提取机打部分与印刷部分的差异化特征,增强特征提取细粒度,搭建像素级图层分离模型,实现机打信息与印刷信息分层剥离;
坐标定位:图层分离后,基于图像识别技术定位各文本条目的坐标信息,通过传统匹配算法完成印刷条目坐标与机打条目坐标的匹配,实现印刷字段与机打字段的关联,破解信息串行对识别准确率的影响;
双识别模型:针对机打文本和印刷文本训练双识别模型,基于两种文本的差异化特征增强二者的区分度,进而提升图层分离精确度,降低信息重叠带来的干扰。
再次,为确保理算信息完整无误,深源恒际基于交叉校验规则引擎,提供“机器校验为主、人工复核为辅”的数据补录工具。基于字段间的逻辑关联关系,自动识别定位到置信度较低的字段信息,通过交叉校验对存疑数据进行启发式纠正;同时,基于医疗词典库对模糊字段进行智能校准,综合多种校验方式辅助人工完成信息复核与补录。
基于OCR技术的医疗票据智能识别与结构化提取解决方案,本质上是通过信息数字化的方式实现了信息采集自动化,以此帮助保险机构或诸如医倍思特的第三方智能理赔平台实现服务流程自动化,从而大幅降低人力投入,高效提升服务质量,让用户体验优化升级。
据了解,自医疗票据OCR产品上线以来,深源恒际已为阳光人寿、太平洋保险等多家知名保险机构和璞映智能、医倍思特等第三方TPA服务平台提供相应技术服务。
- 点赞
- 收藏
- 关注作者
评论(0)