基于技术分析、基本面分析和深度学习的股价预测_李潇俊

李潇俊,唐攀.基于技术分析、基本面分析和深度学习的股价预测[J].统计与决策,2022,38(02):146-150.

研究问题

将技术分析指标、基本面分析指标与混合循环神经网络模型相合构建新型股价预测模型

理论机制

在金融时间序列分析中,运用最广泛的计量模型主要有ARIMA模型和GARCH模型。随着机器学习的发展,将机器学习与传统计量模型结合的技术被运用至时间序列分析之中。

在金融学理论中,对于证券市场研究存在两种投资分析方法:技术分析法和基本面分析法。技术分析是一种基于历史统计数据(如历史开盘价、历史收盘价、移动平均线和成交量等)评估和识别股价交易机会和策略的方法。该方法可基于历史交易数据研究股票、期权等任意证券资产。技术分析理论认为过去的交易行为和资产价格变化对于预测证券未来价格走势是至关重要的。与技术分析不同,基本面分析是基于宏观经济状况和行业发展状况等衡量证券的内在价值。由于金融市场上存在系统性风险和非系统性风险,频繁交易和分散化投资只能降低非系统性风险,对系统性风险是无效的。滚动样本预测评价法基于滚动窗口原理。滚动窗口是依据指定的单位长度来构建时间序列。以一步向前滚动样本预测为例:时间序列x1,x2,…,xn用于获取xn+1的预测值;时间序列x2,x3,…,xn+1用于获取xn+2的预测值;以此类推。通过计算预测值与真实值的滚动窗口误差值,该方法能够更为客观、科学评价预测模型的预测效果。循环神经网络包含两种典型的变体形式:长短期记忆模型(LSTM)和门控循环单元(GRU)。两种变体形式各具有优缺点:LSTM模型解决了循环神经网络不能长期依赖的问题,而GRU模型相较于LSTM模型参数量小,能够减少过拟合的风险。因此,在预测模型构建上,本文将这两种模型结构进行有机结合搭建基于混合循环神经网络的股价预测系统。该预测系统拓展了以往研究的模型结构,并通过实证分析验证该系统对于由技术指标和基本面指标组成的混合指标的股价预测效果。

测度指标体系

模型见底部原文,指标如下:

无风险利率、个股Amihud指标、市场Amihud指标、中国股票市场风险评价系数β

实证数据期间与来源

本文以银行业为例,选取中国工商银行(ICBC)、中国建设银行(CCB)和中国银行(BOC)这三家在银行业具有代表性的商业银行为例进行实证分析。这三家银行股价收盘价数据选取的时间范围为2009年10月21日至2019年10月21日,数据来源于国泰安数据库(CSMAR)。本文将收盘价序列的前80%的数据作为训练样本集,其余作为预测样本集。

结论

1.通过实证分析发现,本文构建的混合循环神经网络的深度学习模型能够结合不同的个股数据特征给出最优的网络结构,且相较于以往研究模型能够获得更小的预测误差。

2.在将基本面分析指标引入预测模型输入值后,本文构建的混合循环神经网络模型在实证分析中依然能够在股价预测上获得较好的预测效果。

小结

本文构建的混合循环神经网络模型由四层网络结构组成:前三层(网络结构1、网络结构2和网络结构3)是LSTM模型和GRU模型的混合组合,第四层Dense层用于预测值的输出。该模型系统拓展了以往研究的模型结构,共包含8种不同的神经网络结构。先通过一元时间序列(由单一收盘价序列组成)检验模型的参数设定及预测效果;再对多元时间序列(收盘价、技术分析指标和基本面分析指标等组成)进行预测分析。在深度学习模型搭建平台选择上,本文基于最新的TensorFlow2.0平台搭建股价预测模型。

个股Amihud指标(ILLIQ)由Amihud(2002)提出。该指标反映的是个股的流动性。市场Amihud指标(AILLIQ)衡量的是整个股市的流动性。

原文


基于技术分析、基本面分析和深度学习的股价预测_李潇俊
http://example.com/2023/07/05/基于技术分析、基本面分析和深度学习的股价预测_李潇俊/
作者
cyx94a
发布于
2023年7月5日
许可协议