帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于递归卷积网络的手写及场景文本识别的研究

导  师: 金连文

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 文本作为社会信息交流的基本工具,其识别任务一直以来作为学术界的研究难点和热点。本文主要对于手写文本以及自然场景文本的识别任务展开研究,二者都存在着相应的难点需要进一步研究攻克。对于手写文本而言,多变的书写风格以及文本中存在的连笔现象对手写文本识别带来相当的挑战。而自然场景文本识别的难点主要集中在其场景多样性上。自然场景文本会受到自然环境的影响,如光照和拍摄角度变化等;而文本区域背景的高复杂性也对识别任务造成相当的困难。基于手写文本、场景文本识别任务存在的困难,本文需要提出对应的解决方案以更好地进行相应文本的识别。本文的主要研究工作和贡献包括:1.对脱机手写文本以及自然场景文本识别任务目前学术界的常见方法进行介绍,分析了每一个方法的优点以及存在的不足。通过对于前人研究分析,得出了基于全图的识别网络基础框架。2.针对脱机手写文本识别问题,本文在基础网络框架上进行多种改进。针对基础框架只能学习水平方向上下文信息的短板,本文提出了多方向递归网络模块。在网络中加入多方向递归模块进行多方向的上下文信息学习,以增强网络的序列学习能力。针对深度网络存在收敛速度慢、收敛效果不佳的问题,本文在网络中加入了捷径连接机制。捷径连接可在网络中引入多层次特征的融合,同时带来了模型集成的效果,优化网络的识别性能。3.针对场景文本识别问题,本文在识别框架中加入注意力机制网络。文中通过加权坐标映射可视化,分析了基础注意力网络对于非水平文本识别能力的局限性,并随之提出了多行注意力网络模型。而针对多行注意力网络对于文本定位不准的问题,本文提出了局部区域信息的学习算法以帮助网络进一步提取细颗粒特征,从而优化网络的序列

关 键 词: 序列文本识别 深度卷积神经网络 多方向递归神经网络 注意力机制 局部区域学习

领  域: [] []

相关作者

作者 朱银锦
作者 张从毕
作者 李世琼
作者 李外香
作者 欧小波

相关机构对象

机构 暨南大学
机构 华南师范大学
机构 中山大学
机构 华南理工大学
机构 暨南大学新闻与传播学院

相关领域作者