中文会议: 第二届全国学生计算语言学研讨会论文集
会议日期: 2004-08-26
会议地点: 北京
主办单位: 中国中文信息学会
出版日期: 2004-08-01
出版地: 北京
机构地区: 北京语言大学
出 处: 《第二届全国学生计算语言学研讨会》
摘 要: 词性标注的关键是兼类词的排歧.本文探讨了一种方法来解决兼类问题,并以动词中的兼类词为切入点做了实验,即利用非兼类动词(纯动词)在大规模语料中的分布信息来判断具体上下文中出现的某个与动词有关的兼类词的词性.这种方法不需要人工标注好词性的训练语料,所需知识仅停留在词表一级,而且对其他存在兼类现象的语言也同样适用.实验结果证明了该方法的可行性.
关 键 词: 兼类词排歧 纯动词 计算语言学 汉语语料库 自然语言处理
分 类 号: [TP391]
领 域: [自动化与计算机技术] [自动化与计算机技术]