帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于CNN的自然场景中文文本定位与识别方法研究

导  师: 高学

授予学位: 硕士

作  者: ;

机构地区: 华南理工大学

摘  要: 伴随着移动设备和移动互联网的飞速发展,获取和传输自然场景图像已经变得十分简单。自然场景图像中含有丰富的信息,包括颜色、纹理、形状、结构和文本等,其中文本信息更是对场景理解提供重要线索。因此,智能地获取图像文本信息对理解、研究和分类图像均有着重要的意义。近年来,随着人工智能技术的飞速发展,该领域越来越受到人们的关注。尤其是在应用卷积神经网络(CNN)及深度学习技术后,自然场景文本检测与识别的性能得到了较大提升。然而,由于自然场景图像中所面临的字体遮挡、大小不一、背景复杂等干扰问题,使得识别性能与实际应用要求还有较大的差距。因此,开展自然场景文字识别方法的研究,不仅具有重要的理论研究意义,而且具有广阔的应用前景。本文旨在研究实现从自然场景图像中提取中文文本信息,并构建一个基于卷积神经网络的中文文本识别系统。传统方法过分依赖所提取图像特征的质量,而特征提取往往需要设计人员具有较好的领域知识,才能构建有效的特征提取方法。鉴于卷积神经网络模型(CNN,Convolutional Neural Network)及其深度学习技术,所表现出的强大特征学习能力和分类性能,本文采用卷积神经网络模型,进行自然场景文本的定位与识别研究,主要研究问题包括:1)自然场景中文文本定位2)自然场景中文文本分割3)自然场景中文文本识别系统框架,并实现一个自然场景中文文本识别演示系统。本文完成的主要工作包括:1、提出了一种基于改进型Faster R-CNN模型的自然场景中文文本定位方法。该方法首先通过改进Faster R-CNN模型中的Fast R-CNN网络结构,然后采用旋转、压缩等方式对样本进行扩充,最后对扩充样本采用更低的学习率和迭代次数来微调(Fine-tuning)从原始数据中学习得到的模型,从而可以提高文本定位的召回率。2

关 键 词: 文本定位 文本识别 随机森林 卷积神经网络

领  域: [] []

相关作者

相关机构对象

机构 广东外语外贸大学法律语言学研究所

相关领域作者