帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

CELM:基于交叉熵的文本检索模型

中文会议: 中国科学院研究生院"21世纪计算机科学与技术"第八届研究生学术研讨会论文集

会议日期: 2004-07-01

会议地点: 大连

主办单位: 中国科学院计算技术研究所

作  者: ; ;

机构地区: 中国科学院计算技术研究所

出  处: 《中国科学院计算技术研究所第八届计算机科学与技术研究生学术讨论会》

摘  要: 本文对文本检索中的查询生成模型进行了扩展,提出一种基于交叉熵(CROSS-ENTROPY)的CELM检索模型.通过统计语言建模技术,CELM模型把用户的信息需求和文档集中的每篇文档表示成词项(TERM)上的一个概率分布,分别称为用户信息需求语言模型和文档语言模型,然后根据这两个概率分布的交叉熵来对文档集中的文档进行排名.CELM检索模型把用户的信息需求直接引入到模型中,有效地解决了实际应用系统中信息需求与查询之间的不匹配问题.

关 键 词: 信息检索 交叉熵 统计语言模型

分 类 号: [T]

领  域: [一般工业技术]

相关作者

作者 刘燕萍
作者 梁颖殷
作者 李金波
作者 朱晓丽
作者 林书怡

相关机构对象

机构 中山大学资讯管理学院
机构 中山大学资讯管理学院信息管理系
机构 中山大学
机构 华南师范大学经济与管理学院
机构 中山大学资讯管理学院资讯管理系

相关领域作者

作者 许治
作者 万良勇
作者 宋舒
作者 黄佑军
作者 王应密