机构地区: 中国科学院自动化研究所
出 处: 《中文信息学报》 1988年第4期
摘 要: 本文以句法模式识别的理论为指导,以大量实践为基础,给出在第四代计算机基础上联机手写汉字识别的形式化和工程化的方法。从汉字识别角度提出,汉字应分成笔段、笔划、字根、字、词组五个层次,分别用模糊属性文法对各个层次进行描述。提出启发式模板引导强制匹配方法,并给出了对根和字的具体匹配过程。在词组的识别中,提出对词组求距离的概念和利用上下文的粗分类方法,描述了词组的存贮结构和词组的匹配过程。利用本文的方法,可以联机识别从楷书至行书范围的手写体汉字,识别率的提高仅与增加各层次的模板有关,与识别方法无关。