中文会议: 第四届全国学生计算语言学研讨会(SWCL-2008)论文集
会议日期: 2008-07-23
会议地点: 太原
主办单位: 中国中文信息学会
机构地区: 北京语言大学信息科学学院语言信息处理研究所
出 处: 《第四届全国学生计算语言学研讨会(SWCL-2008)》
摘 要: HSK动态作文语料库是一个大规模的汉语中介语语料库。人工对其中各类偏误进行了标注。本文针对人工标注的缺陷,提出了偏误自动标注的方法。基于编辑距离算法,以汉语的词为单位通过进一步求解编辑路径发现修正原句所需要的基本编辑操作,从而实现了原句和修正句的自动比对。这样,能够较好地弥补当前中介语语料库标注方法的缺陷,体现了人机的优势互补。
分 类 号: [T]
领 域: [一般工业技术]