导 师: 杨晓伟
学科专业: G0104
授予学位: 硕士
作 者: ;
机构地区: 华南理工大学
摘 要: 汉字识别是模式识别和人工智能领域的一个重要课题,脱机手写体汉字识别则一直是汉字识别中一个极具有挑战性的难题,而细化算法是脱机手写体汉字识别的重要一步,细化算法的优劣将直接决定汉字识别的识别率。本文探讨的主要内容是脱机手写体汉字识别中的细化算法研究。 评价细化算法优劣的标准主要有:(1)细化迭代次数要少,速度要快;(2)骨架图像应尽可能接近原图像的中心线;(3)骨架应保持连通性,不应产生断点;(4)应尽量保持原图像拓扑结构和几何特征,不应产生严重畸变,尤其是“t”形变“y”形畸变;(5)尽量细化为只有一个象素宽的图像。对经典算法比较后发现快速并行细化算法(fpa)是比较好的一种算法,其基本能满足以上几点。 实验研究发现,fpa算法的致命缺陷在于对于一些特定的笔画,fpa算法会将其删除殆尽,直到只剩下最后一个象素点为止。针对以上缺陷,本文提出了基于模板保留的快速并行细化算法(fpa-rt)。实验结果表明,fpa-rt 算法克服了fpa算法的固有缺陷,且运行速度快,对手写体汉字能很好地得到中心骨架,没有断点,较好地保持了原图像的拓扑结构,细化为只有一个象素宽的图像。 最后本文用一种特征提取方法——基于顶点和方向向量的特征提取算法(fesov)对所有细化算法进行验证,从细化结果和汉字特征两方面证明了fpa-rt算法的有效性。
关 键 词: 通用手写体 汉字识别 并行细化算法 特征提取算法 模式识别 人工智能
分 类 号: [TP391.43 TP301.6]