中文会议: 中国科学院研究生院"21世纪计算机科学与技术"第八届研究生学术研讨会论文集
会议日期: 2004-07-01
会议地点: 大连
主办单位: 中国科学院计算技术研究所
机构地区: 中国科学院计算技术研究所
出 处: 《中国科学院计算技术研究所第八届计算机科学与技术研究生学术讨论会》
摘 要: 本文对文本检索中的查询生成模型进行了扩展,提出一种基于交叉熵(CROSS-ENTROPY)的CELM检索模型.通过统计语言建模技术,CELM模型把用户的信息需求和文档集中的每篇文档表示成词项(TERM)上的一个概率分布,分别称为用户信息需求语言模型和文档语言模型,然后根据这两个概率分布的交叉熵来对文档集中的文档进行排名.CELM检索模型把用户的信息需求直接引入到模型中,有效地解决了实际应用系统中信息需求与查询之间的不匹配问题.
分 类 号: [T]
领 域: [一般工业技术]