摘要:汉字具有数千年的历史,中国文明史多以汉字的形式记录下来,同时在这个信息化的时代,信息爆炸式的增长,海量...汉字具有数千年的历史,中国文明史多以汉字的形式记录下来,同时在这个信息化的时代,信息爆炸式的增长,海量的信息让人们处理起来变得异常艰难,因此,如何让计算机高效的获取汉字信息成为解决该问题的关键。汉字识别是处理海量汉字信息的最佳选择,当前多半的识别系统是以OCR(Optical Character Recognition)系统为基础进行开发的,近些年已获得很好的成果,但是在旋转和移动的文字图像的处理上仍有不足之处,本文对此针对性的提出了基于改进图像匹配的汉字识别算法,实验结果说明了这个算法是可行的,可为汉字识别提供一个新的研究思路。本文的主要工作如下:其一,本文首先分析了常用的汉字特征、汉字识别算法和图像匹配算法,并重点研究了一种基于欧氏最短距离的汉字识别方法,并以此为基础进行汉字识别的研究。其二,为了将图像匹配算法引入到汉字识别中,对图像匹配算法进行了改进。由于特征点在匹配后存在错误的匹配点对,并且不同汉字的误匹配对汉字识别的结果有很大影响,提出一种基于距离约束的误匹配消除方法,该方法大幅减少了不同汉字之间的误匹配。其三,为了解决汉字识别在识别复杂图像时识别率下降的情况,本文提出了一种基于上述改进图像匹配算法的两级汉字识别算法。算法首先提取汉字图像的外围特征用于粗分类,接着创新的使用SURF算法描述汉字特征用于细分类,再根据改进的匹配算法对SURF特征点进行匹配,通过计算匹配点数量完成识别过程。实验结果表明这个算法具有较好的识别率,是可行的。显示全部