基于LSTM神经网络的金融时间序列预测_欧阳红兵

欧阳红兵,黄亢,闫洪举.基于LSTM神经网络的金融时间序列预测[J].中国管理科学,2020,28(04):27-35.

研究问题

将小波分析与纳入时间序列依赖特征的长短期记忆(LTSM)神经网络相结合,构建金融时间序列数据预测模型,以克服现有模型对金融时间序列数据非平稳、非线性、序列相关等复杂特征以及数据间非线性交互关系无法反映的缺陷

理论机制

金融时间序列数据不仅受众多因素的影响,且其影响因素间也存在复杂的非线性动态交互关系。进而导致金融时间序列数据成为一个具有序列相关性、非平稳性以及非线性等特征的复杂系统。科学有效的金融时间序列数据预测模型,一是能够充分反映金融时间序列数据的非线性、非平稳、序列相关等复杂特征,二是可有效反映金融时间序列影响因素的非线性动态交互关系,三是具有强大且稳健的特征学习能力,以提取影响金融时间序列数据变动的重要影响信息。传统时间序列预测方法诸如ARMA、GARCH等计量经济学模型通过假定具体的模型来刻画金融时间序列数据。但复杂且含有噪声的真实时间序列数据无法通过含有参数的解析方程来反映,因为时间序列数据的动力学方程或者太过复杂,或者未知。因此,传统的计量经济模型预测方法存在一定局限性。而机器学习尤其是深度学习对于非线性、非平稳数据的处理,变量非线性交互关系的反映,以及数据特征的提取均存在较大优势,其在图像识别、自然语言处理、无人驾驶等诸多人工智能领域取得的广泛应用和巨大成功对此也给予了充分的证明。机器学习关注的主要问题就是计算机程序如何随着经验积累来自动改善系统自身的性能。近年来,国内外学者对其在金融时间序列数据预测研究方面也做了很多有意义的探索。例如,基于支持向量机(SVM)、BP神经网络、SVM-GARCH、灰色神经网络-EGARCH等机器学习模型实现对股票价格的预测。

SVM、BP神经网络等浅层次机器学习算法,对于学习复杂高维度的数据存在较大局限性,且存在维数灾难与无效的特征表示等诸多问题。深度学习则是在神经网络的基础上,进一步加深神经网络隐藏层层数,通过组合底层特征形成更加抽象的高层特征表示,以发现数据的分布式特征表示。与浅层次的机器学习相比,深度学习具备以下两点优势:首先,深度学习采用无监督学习的逐层特征提取,具有更强大的特征表达能力,可学习更加复杂的函数表示。其次,深度学习在提高样本内数据预测精度的同时,更容易缓解过拟合问题,因而具有更强的泛化能力。深度学习在语音识别、视频处理等复杂时间序列数据研究领域所取得的巨大成功也恰恰证实了这一点。深度学习的LSTM神经网络,可以反映金融时间序列数据的非线性及数据间的复杂交互关系,体现时间序列数据的序列相关特征,避免基于传统计量经济模型和浅层次机器学习的金融时间序列数据预测方法所存在的诸多问题。

金融时间序列易受政治、经济、投资者心理等众多因素的影响,通常含有大量噪声,呈现出显著的非线性特征。深度神经网络对于非线性数据具有强大的处理能力,但其在训练过程中如果过度关注对噪声数据的拟合,无疑会降低模型的泛化能力,进而降低其对样本外金融时间序列数据的预测能力。小波分析能够通过伸缩和平移等运算功能对信号进行多尺度细化分析,有效消除金融时间序列中的噪声且充分保留原信号的特征。因此,本文提出采用小波分解与重构对金融时间序列进行数据预处理,通过“小波降噪”剔除时间序列中的噪声高频成分,以降低短期噪声扰动对神经网络结构的影响,提高模型的预测能力。

实证数据期间与来源

数据样本选取区间为2012年01月04日至2017年06月31日,数据来源于Wind资讯。

结论

首先,利用小波分析对金融时间序列进行分解与重构,可有效提高LTSM神经网络的泛化能力,能够更有效地预测金融时间序列数据的短期以及长期动态变化趋势。其次,相较于多层感知机、支持向量机等机器学习算法以及GARCH等计量模型,LTSM神经网络具有更高的预测精度。这也充分证实了LTSM神经网络对实际金融时间序列数据具有强大的预测能力,这对于建立证券市场风险预警机制,为投资者提供决策参考均具重要意义。

小结

本文探究了深度学习的LTSM神经网络应用于金融时间序列数据预测的理论基础与实际应用,提出采用小波分析对金融时间序列数据进行分解与重构,以剔除短期随机扰动噪声的影响,提高模型对样本外数据的预测精度和对未来动态趋势预测能力。

害,是真的难懂!

原文


基于LSTM神经网络的金融时间序列预测_欧阳红兵
http://example.com/2023/07/31/基于LSTM神经网络的金融时间序列预测_欧阳红兵/
作者
cyx94a
发布于
2023年7月31日
许可协议