帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

针对保险理赔单据的光学字符识别的研究与实现

导  师: 黄敏;吴珮琪

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 随着经济的发展,保险业间竞争日益激烈,依靠传统手段拓展市场已经难以满足市场的需求,为了提高自身竞争力,保险公司对信息技术的投入不断提高。保险公司理赔部需要人工处理大量的理赔单据,每天需要对不同的理赔单据进行数据录入,分析与分类。这种反复的工作不但增加了保险公司的运营成本,而且效率低下并且错误率高。在当今保险行业中保单录入的环节已经实现了光学字符识别的录入,由于新保单格式规范,清晰度高,识别效果令人满意。但是理赔单据(用药清单)的自动录入一直没有实施,其主要原因是用药清单来自不同的医疗机构,药物与医疗项目等明细信息表达各不相同,没有统一规范。而且单据的清晰度较低,无法通过简单的数据扫描进行系统录入,中间过程仍需人工干预。本文通过对医疗单据(用药清单)进行图像预处理,结合光学字符识别技术,解决用药清单的自动录入问题,为不同的系统提供用药清单识别功能。主要工作如下,1.本文在识别前增加图像预处理操作,减少光照,图章和倾斜影响因素,使识别度提高至80%或以上。2.本文采用了开源的Tesseract作为识别工具,扩大其识别样本,并且通过机器学习训练Tesseract,减少由于原识别库对中文样本训练程度不足的问题,提高Tesseract对用药清单的识别能力。3.基于图像预处理和光学字符识别的用药清单识别结果仍然达不到理想的效果,通过对比概率,N-Gram和查字典法三种方法的适用性和优劣性,本文最终采用查字典法校对识别结果,通过匹对方式,修复形象字导致的专业术语错误问题,从而使识别率提升至90%或以上。最后本文会通过对识别结果和实验进行分析,说明在研究过程中遇到的问题以及该方法的不足以及一些未来需要改进的方法。

关 键 词: 用药清单 机器学习 光学字符识别

领  域: [] []

相关作者

作者 赵路路
作者 魏胜育
作者 陶红
作者 韦成锋
作者 闰莉

相关机构对象

机构 南方医科大学
机构 华南农业大学珠江学院英语系
机构 广东白云学院
机构 广州大学教育学院心理学系
机构 暨南大学

相关领域作者