中文会议: 大规模信息检索与内容安全
会议日期: 2005-10-27
会议地点: 北京
主办单位: 中国中文信息学会
机构地区: 中国科学院计算技术研究所
出 处: 《第二届全国信息检索与内容安全学术会议》
摘 要: 针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC.LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词与初始查询所表征的主题或概念具有更好的相关性.实验结果表明:与未进行查询扩展时相比,采用LOCOOC方法进行扩展后,平均准确率提高40%以上;与传统的局部反馈方法以及局部上下文分析方法(LCA,LocalContextAnalysis)相比,LOCOOC不仅具有更优的检索性能,而且有着更好的鲁棒性.
领 域: [一般工业技术]