深度学习与中国股票市场因子投资——基于生成式对抗网络方法_马甜

马甜,姜富伟,唐国豪.深度学习与中国股票市场因子投资——基于生成式对抗网络方法[J].经济学(季刊),2022,22(03):819-842.

研究问题

运用深度学习模型研究中国股票市场的收益预测与因子投资

理论机制

资本资产定价模型和FF三因子模型等金融市场资产定价模型的关键在于探究金融市场预期投资收益的决定因素。随着大数据时代的到来,越来越多的股票市场异象和定价因子被发现,以大数据和机器学习为代表的人工智能技术正在逐渐融入并改变金融研究范式。其中,对高维因子大数据的有效信息提取和利用近年来成为资产定价理论与实证研究的焦点。比如,围绕因子大数据信息有效性和冗余性等问题,金融学术界使用机器学习方法,从高维因子大数据中识别出可以持续稳定获得超额收益的少数核心定价因子,并开展股票收益预测和投资策略构建。

随着互联网云计算等技术的发展,深度学习神经网络模型已广泛应用在各行各业,包括以人脸识别和文本识别为代表的计算机视觉领域和以自然语言处理为代表的语音识别领域。由于接近于人脑思维的结构特性和现实应用中的优异表现,深度学习正逐渐成为人工智能的代名词。在金融领域,深度学习也受到金融学术界和业界的广泛关注,但相关应用和研究处于起步摸索阶段。本文创新运用深度学习神经网络模型研究了中国股票市场的收益预测与因子投资问题。深度学习一方面可以通过数据降维和特征提取解决高维陷阱问题,有效挖掘股票特征因子大数据中的显性和隐性信息;另一方面,不同于主成分分析等经典线性机器学习方法,深度学习考虑了数据间的非线性相依关系,可以有效提取股票因子大数据中的非线性信息,并带来资产定价研究的非线性范式革命。

作为无监督深度学习的代表,生成式对抗网络模型最初由提出,诞生至今经历了急速发展,互联网巨头均投入了大量研究资源深化和扩展生成式对抗网络的应用,并成功应用在图片生成和视频生成等领域。受博弈论中二元零和博弈的启发,的框架中包含一对相互对抗的模型:生成器和判别器。不同于传统依靠反向传播进行参数更新的神经网络模型,由于引入了对抗网络而具备了“进化”的特性:生成器利用特征因子大数据集对股票市场收益进行预测,判别器通过正误判断及比较真实实现收益和预测收益,指导生成器完成参数更新。在迭代过程中,二者不断提高各自的生成能力和判别能力来寻找二者间的纳什均衡,从而最终的预测结果相比单一神经网络模型更接近真实收益分布。

实证数据期间与来源

本文选取2003年1月至2017年12月中国A股市场所有股票收益数据,计算股票超额收益使用的无风险收益采用月度的一年期国债收益率,市场组合收益为A股市场所有股票收益流通市值加权平均得到,数据来源为国泰君安数据库。

结论

首先,相比线性模型,生成式对抗网络深度学习预测精度显著提升,其最高预测R方为0.89。其次,依据模型预测构建股票因子投资组合,发现多空策略下投资收益为1.13%(年化为13.56%),最高夏普比率为0.71,累计投资收益显著高出同时期的其他模型收益。本文还将各因子重要度进行排序,并给出理论分析。最后,经济理论机制分析,我们探索了错误定价理论的解释能力,还找到了能够负向或正向影响深度学习预测效果的经济变量,发现深度学习模型能有效挖掘股票市场与宏观经济风险、投资者情绪之间的关系,还能有效预测微观企业在未来一年内的盈利、收入和现金流等基本面状况。

小结

本文的核心是使用生成式对抗网络模型深度学习模型进行股票收益预测,构建多因子资产定价模型。

看的不是很明白,说实话

原文


深度学习与中国股票市场因子投资——基于生成式对抗网络方法_马甜
http://example.com/2023/09/12/深度学习与中国股票市场因子...——基于生成式对抗网络方法_马甜/
作者
cyx94a
发布于
2023年9月12日
许可协议