帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于卷积神经网络的12306验证码识别

导  师: 罗荣华

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 验证码(CAPTCHA),是一种区分用户是人还是机器的自动程序。它是由机器按照特定形式生成的人类认知以内的问题,并可以对用户的回答加以评判,能够在一定程度上有效的避免用特定程序进行暴力破解的批量操作。12306网站验证码的汉字部分为非标准字体,会随机的进行扭曲、形变和噪声;图像部分大多数为中国人生活中很常见的物体,但也有小部分的物体由于人们的年龄、受教育程度等因素的影响而导致识别困难,再加上图像部分整体的分辨率较低,图片模糊,这都给人眼识别带来了很大的不利因素。近年来,随着机器学习技术和计算机硬件的积极发展,人们对卷积神经网络(CNN)的研究也越来越深入,取得的成果也日渐丰富。如今,在多个领域中,卷积神经网络都被得到了广泛的应用。尤其在传统的图像分类问题上,卷积神经网络取得了突破性的成绩。从早期手写数字的识别问题,再到如今如火如荼的ImageNet竞赛,人们见证着Lenet-5到Vgg再到ResNet和Inception网络模型的变化,这是研究人员尝试着用多种办法调整和改良卷积神经网络的结构和参数以用来发挥最优性能的不懈努力的结果。本文结合12306特定文字和图像验证码的特点,在深入了解和研究卷积神经网络的理论和国内外研究成果的基础上,主要做了以下工作:(1)实现了一种基于预训练网络模型上fine-tune小规模数据集的迁移学习方法。通过直接使用网络模型训练和两种迁移学习方法的比较实验,选择出适合本数据集的训练方法。(2)完成了数据集的制作。对用爬虫抓取的一定数量的12306网站验证码进行查重、标记、分类以及数据提升。(3)用vgg-16、vgg-19、inception_v3等经典网络对本数据集进行fine-tune后的结果对比与分析,选择出适合本数据集的网络模型。(4)提出了一种识别12306文字+图像验证码的综合解决方案。更多�

关 键 词: 图像分类 卷积神经网络 迁移学习

领  域: [] []

相关作者

相关机构对象

相关领域作者