帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于双字耦合度的中文分词交叉歧义处理方法

中文会议: 第九届全国计算语言学学术会议论文集

会议日期: 2007-08-06

会议地点: 大连

主办单位: 中国中文信息学会

作  者: ; ;

机构地区: 中国科学院计算技术研究所

出  处: 《第九届全国计算语言学学术会议》

摘  要: 本文提出了一种利用双字耦合度和t-测试差解决中文分词中交叉歧义的方法:首先利用词典找出所有的交叉歧义,然后用双字耦合度和t-测试差的线性叠加值来判断各歧义位置是否该切分。实验结果表明,双字耦合度和t-测试差的结合要优于互信息和t-测试差的结合,因此,用双字耦合度和t-测试差的线性叠加值来消除交叉歧义是一种简单有效的方法。

关 键 词: 中文分词 双字耦合度 测试差 歧义处理 交叉歧义

领  域: [一般工业技术]

相关作者

作者 余栋柱
作者 崔蓉
作者 刘庆明
作者 胡艳胜

相关机构对象

机构 中山大学
机构 华南理工大学软件学院
机构 华南理工大学经济与贸易学院电子商务系
机构 华南师范大学经济与管理学院

相关领域作者

作者 许治
作者 万良勇
作者 宋舒
作者 黄佑军
作者 王应密