帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

加权多视图子空间聚类算法研究

导  师: 戴青云; 曹江中

授予学位: 硕士

作  者: ();

机构地区: 广东工业大学

摘  要: 随着大数据时代的发展,数据的采集和存储技术已经越来越丰富。人们获得的数据往往是由多组特征进行描述的数据即多视图数据。比如,不同视角下拍摄的同一对象的图像数据。此类数据在不同方向对该对象的特征进行描述,既携带了大量互补信息,同时包含了大量冗余信息,并且特征维度高。如何能够有效地对多视图数据进行高效和准确的分析成为巨大的挑战。聚类分析是进行数据分析的一个基本方法,一直以来都受到高度的关注并且发展迅速。其中,在子空间上进行多视图聚类是目前解决多视图数据聚类任务的一个主要发展方向。本文针对多视图子空间聚类方法中如何有效地同时利用视图间的相关性和差异性这一关键问题展开研究,对多视图子空间聚类方法中的视图权重学习提出了优化、改进方案,探索了各视图间的权重分配问题,利用了视图间的关系,提高了聚类的性能。本文的主要研究内容包括:(1)谱聚类算法的研究。谱聚类是稀疏子空间聚类的基础,也是本文开展研究工作的基础。论文研究了谱聚类算法的理论和经典谱图划分方法,介绍了图论理论知识以及Laplacian矩阵,但是谱聚类需要k-means作为后处理的方式进行聚类,而k-means本身对初值敏感。基于谱聚类k-means步骤对参数敏感的问题,进一步研究拉普拉斯秩约束的图聚类算法,对该算法的理论和方法进行介绍和分析。本文将拉普拉斯秩约束的图聚类方法代替传统的谱聚类算法应用在多视图子空间聚类中,实现了多视图子空间聚类不受k-means方法对初始值敏感而产生的不稳定影响。该算法能通过相似矩阵直接得到聚类指标,无需k-means等后处理的聚类方式。(2)自加权的多视图子空间聚类算法设计。为了合理地利用多视图数据视图间的相关性和差异性,研究了关于多视图聚类的加权方式。论文结合基于参数加权以及低秩张量约束多视图聚类方法,提出了基于参数加权的多视图子空间聚类算法。基于该方法的不足之处,进一步结合自加权以及低秩张量约束多视图聚类算法,提出了基于自加权的多视图子空间聚类算法。该方法实现了既能捕捉多视图数据高维相关性又能根据其对聚类的不同贡献度来合理分配权重的目的。实验表明利用提出的算法进行多视图子空间聚类能有效地提高聚类性能。(3)多视图子空间聚类动态分配合理权重的研究。针对多个视图在聚类性能上贡献度的差异性问题,进一步研究了更加合适的加权方式对不同视图的权重进行分配,提出了基于熵的多视图加权方式。为了能够捕捉多视图数据高维相关性的同时避免多视图子空间聚类受k-means影响,本文应用了扩展至多视图聚类的基于1范和2范距离的拉普拉斯秩约束以及低秩张量约束的多视图子空间聚类。本文提出基于熵加权的多视图子空间聚类算法,有效地实现了利用多视图数据高维相关性和不同视图的差异性,动态分配合理权重的目的。更多还原

关 键 词: 多视图数据 [3524026]子空间聚类 [5798727]加权策略 张量 秩约束

分 类 号: [TP311.13;TP391.41]

领  域: [] []

相关作者

作者 林志鹏
作者 贾雪燕
作者 容美平
作者 舒辉
作者 刘小武

相关机构对象

机构 华南理工大学工商管理学院
机构 暨南大学经济学院
机构 华南理工大学
机构 中山大学信息科学与技术学院计算机科学系
机构 佛山科学技术学院经济管理学院

相关领域作者