帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

HSK动态作文语料库偏误标注方法研究

中文会议: 第四届全国学生计算语言学研讨会(SWCL-2008)论文集

会议日期: 2008-07-23

会议地点: 太原

主办单位: 中国中文信息学会

作  者: ; ;

机构地区: 北京语言大学信息科学学院语言信息处理研究所

出  处: 《第四届全国学生计算语言学研讨会(SWCL-2008)》

摘  要: HSK动态作文语料库是一个大规模的汉语中介语语料库。人工对其中各类偏误进行了标注。本文针对人工标注的缺陷,提出了偏误自动标注的方法。基于编辑距离算法,以汉语的词为单位通过进一步求解编辑路径发现修正原句所需要的基本编辑操作,从而实现了原句和修正句的自动比对。这样,能够较好地弥补当前中介语语料库标注方法的缺陷,体现了人机的优势互补。

关 键 词: 汉字处理 介语语料 偏误标注 数理语言学

分 类 号: [T]

领  域: [一般工业技术]

相关作者

作者 魏栋
作者 徐学平
作者 陈文翔
作者 覃丽娜
作者 罗芸

相关机构对象

机构 暨南大学华文学院
机构 华南师范大学
机构 中山大学人文科学学院中文系
机构 华南理工大学

相关领域作者

作者 许治
作者 万良勇
作者 宋舒
作者 黄佑军
作者 王应密