帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于“固结词串”实例的中文分词研究
Research on Stable String Example-Based Chinese Word Segmentation

作  者: ; ;

机构地区: 北京工业大学计算机学院

出  处: 《中文信息学报》 2012年第3期59-64,共6页

摘  要: 近几年的中文分词研究中,基于条件随机场(CRF)模型的中文分词方法得到了广泛的关注。但是这种分词方法在处理歧义切分方面存在一定的问题。CRF虽然可以消除大部分原有的分词歧义,却会带来更多新的错误切分。该文尝试找到一种简单的、基于"固结词串"实例的机器学习方法解决分词歧义问题。实验结果表明,该方法可以简单有效的解决原有的分词歧义问题,并且不会产生更多新的歧义切分。 Chinese word segmentation based on CRF(Conditional Random Field) has attracted the most attention in recent research.But this method has certain defects in handling the ambiguity of word segmentation: eliminating most original ambiguity errors at the cost of more new errors.In this paper,we attempt on a simple and example-based machine learning method to deal with the problem of word segmentation ambiguity: the method based on stable string.The experiment results indicate that stable string based method can solve the ambiguity simple and effective.And it will not introduce more new errors.

关 键 词: 中文分词 固结词串 分词歧义 机器学习

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 余栋柱
作者 崔蓉
作者 刘庆明
作者 胡艳胜
作者 李芮

相关机构对象

机构 广东外语外贸大学
机构 华南师范大学
机构 暨南大学
机构 中山大学
机构 华南师范大学教育科学学院心理学系

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊