中文会议: 中国计算语言学研究前沿进展(2009-2011)
会议日期: 2011-08-20
会议地点: 中国河南洛阳
出版方 : 中国中文信息学会
机构地区: 南京大学计算机科学与技术系计算机软件新技术国家重点实验室
出 处: 《第十一届全国计算语言学学术会议》
摘 要: 汉语缩略语在现代汉语中被广泛使用,其相关研究对于中文信息处理有着重要的意义。本文提出了一种从英汉平行语料库中自动提取汉语缩略语的方法。我们首先对双语语料进行词对齐训练,利用训练得到的词对齐信息抽取出候选中英文短语对。然后用SVM分类器提取出质量高的短语对。最后再从质量高的短语对集合中利用英文翻译及一些汉语缩略-全称对应规则提取出汉语缩略语及全称语对。实验结果表明,该方法提取出的缩略语具有较高的准确
领 域: [自动化与计算机技术] [自动化与计算机技术]