帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于监督信息特性的主动半监督谱聚类算法
Active Semi-supervised Spectral Clustering Based on Pairwise Constraints

作  者: ; ;

机构地区: 深圳大学信息工程学院

出  处: 《电子学报》 2010年第1期172-176,共5页

摘  要: 半监督聚类是利用少部分监督信息辅助大量未标签数据进行非监督的学习,其聚类性能的改善依赖于监督信息,因此挖掘适合半监督聚类的监督信息非常关键.提出了一种基于监督信息特性的主动学习策略,即找出同一类中距离相对较远的数据对象对和不同类中距离相对较近的数据对象对组成监督信息,并将其引入谱聚类算法,构建新颖的主动半监督谱聚类算法ASSC(Active Semi-supervised Spectral Clustering).利用该监督信息调整谱聚类中点与点之间的距离矩阵,使类内各点紧聚,类间散布.通过对UCI基准数据集以及人工数据集的实验结果表明,ASSC算法优于采用随机选取监督信息的谱聚类性能. Semi-supervised clustering uses a small amount of supervised data such as pairwise constraints to aid unsupervised learning.The improved clustering performance depends heavily on the choice of constraints.This makes it important to explore the appropriate pairwise constraints for semi-supervised clustering.This paper presents a method for actively selecting informative pairwise constraints,which corresponds to pick up data pairs far apart in the same cluster and those close in different clusters.An active semi-supervised spectral clustering(ASSC) is then developed by utilizing the selected pairwise constraints to adjust the distance matrix in spectral clustering.As a result,the intra-cluster distance is decreased and the inter-cluster distance is increased.Experimental results on UCI benchmark data sets and artificial data set show that these informative pariwise constraints lead to substantial performance enhancement over the random selective pairwise constraints spectral clustering.

关 键 词: 谱聚类 半监督聚类 主动学习 监督信息

领  域: [自动化与计算机技术] [自动化与计算机技术] [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 邓广华

相关机构对象

机构 广东岭南职业技术学院电子信息工程学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊