摘要:对股市趋势的准确预测是金融市场的圣杯,但是其混沌动态的变化特性一直都在挑战金融和计算机领域的新技术。...对股市趋势的准确预测是金融市场的圣杯,但是其混沌动态的变化特性一直都在挑战金融和计算机领域的新技术。近年来,数据挖掘算法的新突破为该领域的研究工作注入了许多新方法与新思路。金融时间序列数据作为股票交易市场的外在表现形式,其中蕴含着大量的信息,对其进行分析、预测是金融研究中的重要工作内容。本文将时间序列分析上的预测算法分为两大类:第一类算法通过挖掘时间序列上行为模式来实现预测,如Motif、自组织映射等;第二类算法通过最小化损失函数的方式来拟合真实的数据分布,从而获得真实输出的近似结果,如神经网络、SVM等。在本文中,以股票价格时间序列作为研究对象,对两类算法展开了探索与尝试。首先根据金融时间序列中所含模式动态变化、难以确定起始点的特点,定义了一个蕴含模式信息的代表模式集,并在其基础上,设计和和实现了从时间序列中提取代表模式集的基于特征点的代表模式集挖掘算法(Represent Pattern Discovery Based on Feature Point,简称为RPD),和基于部分匹配与弹性匹配思想的趋势预测算法(Prediction by Partial and Elastic Matching,简称为PPEM),使用了深度学习算法中的长短期记忆(Long Short-Term Memory,简称为LSTM)神经网络对股价时间序列进行预测,检验该方法在金融预测领域的实际效果。另一方面,鉴于论文中的价格信息仅是市场全部信息的低维投影,所使用的单一方法在预测上都具有片面性,分别使用PPEM与LSTM这两种方法从模式挖掘与数据拟合两个角度对金融时间序列数据进行预测,在预测效果上具备潜在的互补性。因此本文提出组合模型方法,结合两种方法的预测优势,分别使用线性组合与误差拟合两种方式构建了LSTM-PPEM组合预测模型。论文使用真实的股票交易数据对文中方法进行检验,发现PPEM与LSTM两种方法在预测准确率上表现较好,平均可达55%,但是PPEM的均方根误差(Root Mean Square Error,简称为RMSE)偏高。建立组合模型后,其中基于线性组合的预测模型在准确率上和LSTM持平甚至超过2%,同时在RMSE上保持在最低水平,平均比其他三种方法改善3%~14%;而基于误差拟合的组合模型由于PPEM预测残差的低相关性,使得其RMSE较高且准确率仅在52%左右。更多还原显示全部