帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

一种基于名词短语的检索结果多层聚类方法
A multi-level clustering approach based on noun phrases for search results

作  者: ; ; ; ; ;

机构地区: 广东外语外贸大学思科信息学院

出  处: 《山东大学学报(理学版)》 2010年第7期39-44,49,共7页

摘  要: 对检索结果聚类可以方便用户快速浏览搜索引擎返回结果。为了提取主题表达能力和可读性强的类别标签,获取高质量的聚类结果,提出基于名词短语的检索结果多层聚类方法:提取名词短语作为候选类别标签,根据候选类别标签分布情况生成基础类,再使用具有线性时间复杂度的一趟聚类算法对基础类进行多层聚类。与基于命名实体的方法、STC和Lingo算法的对比实验表明:提出方法在类别标签的可读性、有效性以及聚类性能上都优于以上3种方法。 Clustering search results can facilitate users to browsing the results quickly.In order to select much informative,readable cluster labels and get high qualitative clustering results,a multi-level clustering approach based on noun phrases(MCNP) was proposed for search results.Firstly,select noun phrases as candidate cluster labels and generates basic clusters based on the distribution of candidate cluster labels.Secondly,proceed multi-level clustering on basic clusters using a one pass clustering algorithm with linear time complexity.Finally,comparative study was carried out with name entities based method,STC and Lingo search results clustering algorithms,and the results demonstrated that our approach could get much more informative,readable cluster labels and was more effective than the above three methods.

关 键 词: 信息检索 检索结果聚类 文本聚类 多层聚类

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 黄家兴
作者 郭博
作者 苏敷胜
作者 朱幸燕
作者 陆烁

相关机构对象

机构 中山大学资讯管理学院
机构 中山大学
机构 中山大学资讯管理学院信息管理系
机构 华南师范大学经济与管理学院
机构 中山大学资讯管理学院资讯管理系

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊