央行货币政策报告文本信息、宏观经济与股票市场_姜富伟
姜富伟,胡逸驰,黄楠.央行货币政策报告文本信息、宏观经济与股票市场[J].金融研究,2021(06):95-113.
研究问题
分析中国人民银行货币政策执行报告的文本情绪、文本相似度和文本可读性等多维文本信息,刻画央行货币政策执行报告的文本特征,探究货币政策报告的文本信息与宏观经济和股票市场的关系。
理论机制
中央银行沟通是指中央银行向公众披露货币政策目标、货币政策策略及未来货币政策走向等信息的过程。
经济金融文本分析的核心在于用适当的方法提取文本样本的特征信息,主要集中于探究文本情绪(tone)、文本相似度(similarity)和文本可读性(readability)等几类文本指标对经济走势和金融市场的反映或影响。经济金融文本情绪相关的国外文献可以分为三类:第一类文献研究公司公告的文本情绪对公司股票价格的影响。第二类文献研究媒体报道文本情绪对股票市场的影响。第三类文献研究中央银行沟通的文本情绪与宏观经济和金融市场的关系。国内经济金融文本情绪分析主要集中于两类文本对象:媒体报道和公司财务报告。文本相似度(similarity)是指两个文本在遣词造句或表达含义上的相似程度,货币政策报告的文本相似度即报告文本用词的一致性,刻画着不同期报告所含信息差异的大小。文本相似度的研究集中于对中央银行沟通的研究。文本可读性(readability)指阅读和理解文本的难易程度,阅读和理解文本的难度越大,其可读性越低;阅读和理解文本越容易,可读性越高。
实证数据期间与来源
本文计算文本情绪的对象是人民银行每季度公布一次的《货币政策执行报告》。报告是人民银行用于向社会各界介绍货币信贷情况、分析货币政策效果、回顾金融市场情况、阐述宏观经济走势、点明货币政策方向的重要书面沟通手段。第一期报告(2001年第一季度报告)于2001年5月公布于人民银行官方网站上,此后每隔3个月发布新的报告。一般而言,每个季度的报告会在该季度过后的第二个月发布。本文使用的报告从2001年第一季度起,至2018年第三季度止,共71篇文本。在对报告进行文本分析前,我们对报告进行了预处理,删除了所有标点符号,去掉了所有标题和非正文的文本内容。本文选取的股票指数包括上证综指、深证成指、沪深300和中证500,涵盖大市、大盘股和中小盘股等不同股票类型的收益状况,涵盖的时间范围为2005年10月1日至2018年12月31日。所有指数的日度涨跌幅数据均来源于Wind资讯。
结论
货币政策报告的文本情绪与诸多宏观经济指标有着显著的相关性。在控制经济增长和货币政策后,报告文本情绪对报告发布后股票市场的收益率有显著的正向影响。报告文本相似度越高,股票市场波动性越小;反之,报告文本相似度越低,股票市场波动性越大。报告文本可读性高低对股票市场波动性的影响并不显著。进一步研究发现,报告文本情绪中对股票市场有显著影响的是其反映央行政策指引的部分,而反映宏观经济基本面状况的部分对股票市场影响并不显著。
小结
一个可参考的jieba库使用方法:
文本分析的基础是对文本进行分词,分词的基础是分词工具自带的词库。中文文本中较为常用的分词方法为jieba分词,然而jieba分词自带的通用词库无法很好地识别经济金融文本中的专有名词。Python中jieba模块的词库为开源词库,用户可以自行添加词库中不包含的词语,我们将经济金融相关的一些专业术语添加到jieba模块的词库中,以提高分词的准确性。目前国内中文专业词汇的词库较少,其中搜狗词库作为涵盖面相对较广、知名度相对较高的专业词库,在语义学和文本分析研究中得以广泛应用。搜狗词库容纳了许多经济金融专业词库,我们挑选了三个下载量较大的经济、金融、财会词库。在jieba开源词库中加入搜狗词库后,绝大多数经济金融专业名词都被正确分词,分词效果提升显著。
经济金融文本用词的情感倾向与通用文本有较大区别,为此两位学者开发出了目前在英文经济金融文本分析中占有重要地位的LM词典。实证研究表明LM词典应用于经济金融文本分析的结果要明显优于通用情感词典。
一般而言,金融资产收益率呈现出有偏和尖峰肥尾的特点,下文对本文所用的股票市场收益率数据的描述性统计也可以看出这些特点。ARCH类模型的应用能够有效地刻画金融资产收益率的这些特点造成的异方差性。本文使用EGARCH(1,1)模型来对股票市场收益率进行计量分析。