导 师: 杨晓伟
授予学位: 硕士
作 者: ;
机构地区: 华南理工大学
摘 要: 支持向量机(SVM)作为数据挖掘、模式识别的重要学习方法,不仅可用于数据分类,还可用于回归分析。目前回归作为支持向量机的重要研究方向,支持向量回归机(SVMR)模型和算法得到迅速发展,但仍存在很多缺点。非在线回归机在大规模问题上,训练时间太长,不能实时更新超平面信息,且拟合优度对维度的大小比较敏感;在线回归机虽能实现增量学习,但建模耗时过长,且拟合优度偏低的问题也未得到解决。目前回归机都是以处理向量数据为主,但大数据时代,数据更加复杂、多元化,张量数据阶数、维度更高。以往算法直接将张量拉伸成向量进行模型训练,则可能会造成维数灾难和拟合优度偏低。杨晓伟等人将向量机模型推广至张量上,提出支持张量机,其秩一分解将张量分解成向量的外积,不仅降低数据维度,且能保持数据结构信息,提高了分类性能。针对目前回归模型存在的缺点和张量的独特性质,本文首先提出支持张量回归机模型;其次基于Bordes等人提出的快速在线核分类器算法,提出新算法——基于张量的快速在线核回归机。算法包括增量和减量过程:增量过程旨在实时添加样本更新超平面信息;减量过程旨在剔除非支持张量,减小工作集规模。两个过程不仅能快速求解模型,减少训练时间,且拟合精度也有提高。本文在17个张量数据集上进行实验,将新提出的算法与支持向量回归机(非在线)和在线增量回归机,进行时间和拟合优度比较。研究结果表明基于张量的快速在线核回归机拟合优度大都比另两种算法好;数据维度、规模越大,训练时间耗费相对另两种算法越少。
关 键 词: 张量 快速在线核回归机 支持张量回归机 在线增量回归机
分 类 号: [TP18]
领 域: [自动化与计算机技术] [自动化与计算机技术]