帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于LCS的中文缩写字段匹配问题的研究
Research on LCS Based Chinese Abbreviation Field Match

作  者: ; ;

机构地区: 山东省人民检察院

出  处: 《山东科学》 2008年第4期52-56,共5页

摘  要: 鉴于中文字段匹配在信息检索领域的重要性以及日益复杂的检索需求,本文首次提出并实现了基于最长公共子序列LCS的中文缩写字段匹配模型,避免了繁琐的分词操作,将字段匹配过程简单化。在CWT100G数据集部分网页上的实验表明,该方法性能比较稳定,检索效果比较好,尤其在较长缩写字段的匹配方面效果更优于传统的基于字符串匹配的分词模型。 We initially present and realize a Longest Common Subsequence (LCS) based Chinese abbreviation field match model in view of its significance in information retrievil and increasingly complicated search demands, which avoids the fussy operation to word segment and simplifies the process of field match. Experiment in partial webpage of CWTIOOG dataset shows that the approach is stable in performance and preferable to retrieval results, and that it is superior to the traditional string match based word seyment model especially in the longer Chinese abbreviation field match.

关 键 词: 信息检索 中文缩写字段匹配 最长公共子序列 分词

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 刘燕萍
作者 梁颖殷
作者 李金波
作者 朱晓丽
作者 林书怡

相关机构对象

机构 中山大学资讯管理学院
机构 中山大学资讯管理学院信息管理系
机构 中山大学
机构 华南师范大学经济与管理学院
机构 中山大学资讯管理学院资讯管理系

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊