帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

随机在线CP分解算法

导  师: 杨晓伟

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 随着计算机技术的快速发展,每日待处理的数据量飞速增长,储存这些数据的数据结构和类型也越来越复杂。在机器学习、数据挖掘、计算机视觉等领域,越来越多的数据可用张量进行表征,例如传感器、网络、图像、视频等数据,这些张量数据通常是以数据流形式获取。然而传统的离线学习算法必须使用全量数据进行训练,而且实时数据不能确定数据的到达时间、到达顺序且数据量未知,若把所有数据存储起来再进行离线学习是不现实的。而在线学习能不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识。CP分解是一种有效的张量分解算法,本文基于随机抽样CP分解算法和在线CP分解算法的思想,提出了一种新颖的在线CP分解算法:随机在线CP分解算法(ROCP)。该算法可以实时处理大规模高阶在线张量数据,通过使用随机抽样算法,将在线CP分解中计算量巨大的Khatri-Rao积求解问题转化为Hadamard积求解,从而极大地降低算法的运行时间,减少内存需求。同时本文还提出了一种选取在线CP分解算法初始化最优解的办法,保留迭代过程中信息保留率最高时所对应抽样后的Khatri-Rao积矩阵集合和形成此矩阵的因子矩阵集合,使得随机在线CP算法可以得到一个较好的初始解。本文以9个人工数据集和6个真实数据集为实验数据,对Batch Cold算法、Batch Hot算法、OnlineCP算法、ROCP算法的实验平均运行时间、信息保留率、可扩展性和对初始解的而敏感程度进行对比。实验结果表明:本文提出的ROCP算法在时间上明显优于Batch Cold算法、Batch Hot算法和OnlineCP算法,而且张量数据规模越大,时间优势越明显,更能满足实时处理的需求。可扩展性分析显示,在处理时间维度很大的张量和在线进入不同批次大小张量时,ROCP算法十分稳定,平均运行时间最短。综上所述,本文提出的ROCP�

关 键 词: 张量分解 分解 在线学习 随机抽样

领  域: []

相关作者

相关机构对象

相关领域作者