Comparison between Machine Learning Monetary Policy Model and Traditional Rule-Based Model
With the wide application of machine learning algorithms, the question of whether the machine learning model of monetary policy is more advantageous than the traditional rule-based model is an important research topic. This paper compares the Taylor rule model and the machine learning model, firstly, predicts the Taylor rule value and the machine learning value of the interest rate; secondly, evaluates the accuracy of the interest rate prediction by using a variety of indicators; finally, constructs a multiple regression model to evaluate the monetary policy model. The results show that, compared with the Taylor rule model, the machine learning algorithm predicts interest rates with smaller errors under a variety of different evaluation indexes, which can predict interest rates more accurately, and the key economic variables corresponding to the interest rates predicted by the machine learning algorithm, i.e. GDP and CPI, have smaller differences from the actual values, which can be better applied to the real world, and therefore, the machine learning monetary policy model is better.
Taylor Rule
近年来,全球经济已经经历了重大变革和挑战,包括金融危机、地缘政治紧张情势和COVID-19大流行等。这些因素使中央银行维持价格稳定和促进经济增长的任务变得越来越困难。在这种情况下,精确和健壮的货币政策模型的需求变得比以往任何时候都更加迫切。
自上世纪80年代以来,世界上主要国家中央银行已经开始逐步放弃货币数量目标制并转向利率调控,各国的利率决策都隐含地遵循“泰勒规则”,并以此作为重要的利率决策参考。我国也不例外,随着我国经济的市场化程度不断提高,数量目标的局限性开始显现,仅靠数量型调控已难以满足我国货币政策调控的需要
货币政策调控方式从数量型向价格型转变后,对利率的把握和调控是一个需要解决的问题。传统的规则型方法,如泰勒规则,几十年来已经是价格型货币政策决策的基石。它虽然简单明了,但可能无法总是捕捉到现代经济环境中的复杂性和非线性。另一方面,机器学习方法,如神经网络、支持向量机和随机森林,已经在各个领域成功地处理了复杂和非线性关系。这些技术有可能通过利用大规模经济数据和先进的计算算法提供更准确和适应性更强的货币政策预测。然而,它们在货币政策模拟中的应用仍处于初级阶段,并且尚未对它们与传统规则型方法的性能进行全面评估。
本文通过三个步骤来比较机器学习型货币政策模式和规则型货币政策模式。首先,将分别使用泰勒规则和选定的机器学习方法来获得利率的泰勒规则值和机器学习值。其次,使用这两种方法获得的利率值估算GDP和CPI两个目标。最后,通过对比精准度指标和两种方法估算的GDP和CPI两个目标的残差平方和,以确定哪种方法更优。本研究的主要目标是提供关于机器学习技术在货币政策模拟中的有效性以及它们潜在超越传统规则型方法的能力的有价值见解。本研究的发现可能对中央银行和政策制定者在寻求更准确和适应性更强的货币政策模型方面具有一定影响。
本文后续章节安排如下:第2节提供了关于规则型和机器学习方法货币政策模型的相关文献的简要概述。第3节介绍了本文所使用的利率预测方法与数据。第4节进行了实证分析,并对比了两种方法的准确度。第5节总结了论文。
随着金融创新和金融脱媒的快速发展,各国纷纷抛弃了过去依赖货币供给目标的货币政策框架,转而重点关注利率调控
在我国货币政策转型过程中,选择和验证适用于中国实际环境的泰勒规则具有重要的理论和实践价值,同时也对利率的预测具有重要的指导意义。许多学者对泰勒规则的适用性进行了检验,发现泰勒规则可以较好地衡量中国的货币政策,并且也能够描述利率的具体走势
相对于线性模型,机器学习算法能从大量的数据中学习并提取复杂的模式和关系,并在面对新数据时表现出良好的泛化能力,受到广泛关注。由于经济金融领域需要处理大量的复杂非线性数据,机器学习逐渐在经济金融领域发光发热,机器学习在经济金融领域中的应用主要可以分为三个方面
可以发现,尽管机器学习技术在经济金融领域越来越受欢迎,但它们在货币政策中的应用仍然相对有限,泰勒规则仍然是货币政策抉择中的一项重要参考。但泰勒规则的适用性和稳定性仍然存在一定的问题,因此发挥机器学习在分析、预测方面的优势,理论上能够更好地支持货币政策抉择。
连续性在货币政策中极其重要,因为频繁和剧烈的政策转变可能会削弱政策效果,引起市场不稳定。平滑泰勒规则通过调整利率的过程中引入前期利率,使政策更加平滑,有助于维护经济和金融市场的稳定。因此,本文使用所有的历史数据来拟合利率平滑泰勒规则,并获取所有参数,为了方便使用最小二乘法(OLS)估计
(1)
进行利率预测时,长短期记忆(LSTM)模型相较于其他算法具有明显优势。首先,LSTM是一种能够处理序列数据的神经网络,可以捕捉时间序列数据中的依赖关系,而利率预测问题正是一个典型的时间序列数据预测问题。其次,LSTM具有记忆单元,可以避免梯度消失或爆炸问题,使得模型能够学习到更长的序列依赖关系。在处理利率预测问题时,利率的变化可能会受到许多因素的持续影响,使用LSTM可以更好地捕捉这些关系,从而提高预测的准确性。此外,LSTM在处理序列数据时具有较好的泛化能力,能够较好地应对数据中的噪声和变化。在实际应用中,利率的数据可能会存在如异常值等问题,使用LSTM可以较好地处理这一问题,并且能够适应数据的变化。而其他方法,如决策树、支持向量机等,在处理这些问题时可能表现不如LSTM。
综上所述,LSTM模型能够更好地捕捉利率的时间序列特征,提高预测的准确性,因此本文首先选择使用LSTM模型预测利率。
如
1) 遗忘门:决定哪些信息应该从单元的状态中被抛弃或保留。
(2)
其中, 是在时间步t的忘记门的激活向量, 是Sigmoid函数, 是遗忘门的权重矩阵, 是遗忘门的偏置项, 是前一个时间步的隐藏状态, 是当前时间步的输入。
2) 输入门:决定哪些新的信息将被存储在单元的状态中。
(3)
(4)
其中, 是输入门的激活向量, 是候选单元状态,表示可能会加入到当前单元状态的新信息。
3) 单元状态:根据遗忘门和输入门的结果,更新细胞状态。
(5)
其中, 是当前时间步的单元状态, 是上一个时间步的单元状态。
4) 输出门:从当前细胞状态中输出哪些信息到隐藏状态。
(6)
(7)
其中, 是输出门的激活向量, 是输出门的权重矩阵, 是输出门的偏置项。
为进一步验证其他机器学习算法在预测利率方面的可行性,本文选择随机森林这一更为泛用的机器学习算法。随机森林能够有效处理高维数据,而利率的预测正需要多种经济数据,这些数据包含许多特征。随机森林通过构建多个决策树来处理这些高维数据,每个决策树都能捕捉到一部分特征的重要性,从而避免了单一模型因维度灾难而失效的问题。不仅如此,随机森林具有较强的抗过拟合能力和鲁棒性。由于其采用的是集成学习的方法,即通过结合多个决策树的预测结果来得到最终的预测值。一方面,这种机制可以减少单个决策树对特定训练数据集的过度依赖,从而提高模型的泛化能力;另一方面,即使其中一些决策树的表现不佳,整个模型的性能也不会受到太大影响。因此,在预测利率时,随机森林也是一个较为优越的算法。随机森林的结构原理如
为了获得时间段内的所有利率预测值,本文所使用的是一种滚动窗口预测方法,这种方法的核心在于其迭代的过程:首先,将数据集的前两个月作为初始测试集(由于使用了利率滞后项,第一期数据剔除),而将剩余的数据用作训练集来训练预测模型。在模型训练并预测了第一个两个月的利率之后,测试集会滚动到下一个三个月,同时新的测试集更新为该三个月以外的所有数据。这个过程持续进行,每次都将新的三个月数据作为测试集,以此类推,直至覆盖整个数据集。采用滚动窗口策略的好处在于,它既能够预测整个时间段内的所有数据,又能够防止信息泄露,即数据既在训练集中出现,又在测试集中出现。总的来说,这种方法提供了一种灵活、动态且可靠的方式来适应并预测复杂的金融时间序列数据。
在这两种方法下,模型参数调整是通过两种不同的优化技术实现的:LSTM模型通过贝叶斯优化框架(Optuna)进行参数调整,它利用历史信息来智能地选择参数,以便更有效地探索参数空间。随机森林模型采用了随机化搜索(Randomized Search CV),这种方法通过在预定义的参数分布中随机采样来近似最优解。
利率预测的精确性对于经济政策制定和金融市场的稳定性至关重要。通过将预测利率对应的GDP和CPI与实际值进行比较,可以有效评估预测利率的准确度和可靠性。这种做法的主要支持理由在于GDP和CPI作为两个核心经济指标,它们的表现直接影响到利率的调整和货币政策的制定。
首先,GDP是衡量国家经济活动总量的指标,反映了经济的总体健康状态。预测的利率通常基于对未来经济增长的预期;如果实际GDP与预测值相差较大,这可能表明利率预测未能准确反映经济实际运行情况,从而指出需要调整利率预测模型或输入参数。其次,CPI是衡量通胀水平的重要指标,通胀预期是中央银行设定利率的重要依据。如果预测利率下的CPI与实际通胀率出现显著偏差,这意味着利率水平可能没有适当反应经济中的价格变动,进而影响到货币政策的有效性。
为了能够获取不同利率水平对应的GDP和CPI,本文构建了两个多元线性回归模型,通过估计不同变量的反应系数进而计算具体的GDP和CPI数值。模型如下:
(8)
(9)
其中,IR为利率,利率是中央银行控制货币供应和稳定经济的主要工具。较低的利率可以刺激企业投资和消费者支出,从而提升GDP,但同时也可能导致CPI上升,因为货币供应增加可能引发通货膨胀。相反,较高的利率旨在遏制通货膨胀,可能会通过减缓经济活动而对GDP产生负面影响。SM为上证指数,上证指数反映了中国最大的股票市场之一的整体表现,通常被视为经济信心的晴雨表。股市的繁荣通常与企业盈利能力和投资增长相关联,这有助于推动GDP增长;然而,股市波动也可能加剧经济周期性波动,影响消费者和企业的信心,进而影响CPI。ER为有效汇率,有效汇率,尤其是实际有效汇率,衡量的是一国货币相对于其主要贸易伙伴的货币的综合强弱,并调整了通货膨胀差异。一个国家的货币如果在实际条款中走强,可能会抑制出口增长(因为商品和服务对外国买家来说变得更昂贵),这可能对GDP造成压力。同时,强势货币可能会降低进口商品的价格,从而对CPI产生下行压力。PGR为人口自然增长率,人口自然增长率影响劳动力市场供应,进而影响生产潜力和消费需求。人口增长可以扩大经济规模,理论上可以促进GDP的增长;同时,更多的消费者意味着更高的消费需求,可能会推升CPI。IE为进出口总额,进出口活动是国际贸易的直接体现,是连接国内经济与全球市场的纽带。出口的增加可以直接增加GDP,而进口的增加提供了消费者和企业对外国产品的需求,这可以在短期内抑制国内价格水平,影响CPI。UR为失业率,失业率是劳动力市场健康的关键指标,高失业率可能意味着经济资源的闲置,导致GDP增长放缓。此外,高失业率通常会降低工资压力,减少消费者的购买力,可能会对CPI产生下行压力。
泰勒规则所关注的核心指标为通货膨胀缺口和产出缺口。通货膨胀缺口是指实际通货膨胀率与目标通货膨胀率之差,CPI是衡量一篮子商品和服务价格变动的指标,通常被用来反映通货膨胀的水平。通货膨胀缺口反映了当前经济中通货膨胀率偏离目标的程度,目标通货膨胀率是根据每年国家官方发布的“国民经济和社会发展计划执行情况”中的预期CPI确定的。产出缺口是指实际产出与潜在产出之间的差距,潜在产出可以理解为在经济运行在充分就业和资源利用水平的情况下可以实现的产出水平。HP滤波是一种常用的时间序列分解方法,用于将原始时间序列分解为趋势和波动两个部分。对于产出缺口的测度,可以使用HP滤波对实际产出进行处理,从而得到趋势部分(潜在产出)和波动部分(经济波动)
机器学习算法的一个优点是可以加入诸多数据并捕捉这些数据的复杂关系。本文使用上期通货膨胀率、上期通胀缺口、上期产出缺口、上期美国国债收益率、上证指数、上期人口增长率和上期利率来预测当期利率。美国国债十年期收益率是全球利率水平的一个基准,可以影响包括中国在内的其他国家的利率。上证指数反映了中国股市的整体表现,股市的表现与利率政策密切相关,因为利率变化会影响投资者对股票的预期回报。人口增长率反映了劳动力市场的潜在供给情况,长期来看,人口增长率对经济增长和通胀有着深远影响,进而可能影响到利率水平。最后,上期利率作为历史数据,可以帮助分析利率的趋势和周期性变化,为预测未来利率水平提供参考。由于部分数据可得性的限制,本文使用了1996年1月~2023年12月的数据,变量的选取及描述性统计见
变量名称 |
选取数据(计算方法) |
最小值 |
最大值 |
平均值 |
标准差 |
样本数 |
利率 |
全国银行间同业拆借加权平均利率:7天 |
0.99 |
12.72 |
3.492 |
2.456 |
336 |
通货膨胀率 |
消费者价格指数 |
−2.2 |
9.8 |
2.116 |
2.341 |
336 |
通胀缺口 |
当期通胀率 − 目标通胀率 |
−5.78 |
9.34 |
1.17 |
2.692 |
336 |
产出缺口 |
100*LN(实际产出/潜在产出) |
−11.263 |
2.487 |
−.006 |
1.227 |
336 |
美国国债收益率 |
美国国债十年期收益率 |
0.62 |
6.91 |
3.628 |
1.555 |
336 |
上证指数 |
上证指数:月度均值 |
530.04 |
5824.12 |
2382.634 |
954.454 |
336 |
人口增长率 |
人口自然增长率 |
−0.01 |
0.09 |
0.045 |
0.024 |
336 |
国内生产总值 |
国内生产总值季度数据转月度数据 |
875.84 |
7912.81 |
3657.172 |
2195.667 |
336 |
有效汇率 |
有效汇率指数:2020年 = 100 |
65.6 |
106.38 |
84.392 |
12.493 |
336 |
进出口总额 |
进出口总额年度数据转月度数据 |
1830.927 |
35197.113 |
15783.126 |
10269.204 |
336 |
失业率 |
失业率年度数据转月度数据 |
2.925 |
5.746 |
3.966 |
0.57 |
336 |
注:以上数据从中国人民银行、choice数据库、国泰安数据库等搜集。
泰勒规则中所有的参数见
参数 |
|
|
a1 |
a2 |
a3 |
R2 |
估计值 |
0.9304 |
0.68 |
0.8436 |
−0.4741 |
0.5180 |
0.960 |
三种方法预测的利率分别绘制于
当评价预测模型的精确度时,使用的常见指标包括均方根误差(RMSE)、均方误差(MSE)、平均绝对百分比误差(MAPE)和平均绝对误差(MAE)。这些指标各自从不同角度衡量了模型预测值与实际值之间的差异。
预测精准度的结果见
总体而言,LSTM和随机森林模型的表现说明了它们能够在预测利率上提供更为精确的结果。
指标 |
泰勒规则 |
LSTM |
随机森林 |
RMSE |
0.00603952 |
0.004766182 |
0.004997064 |
MSE |
0.00003647 |
0.00002271 |
0.00002497 |
MAPE |
11.02674025% |
9.070010578% |
9.89609185% |
MAE |
0.003471822 |
0.002830489 |
0.003075297 |
对GDP和CPI的多元回归结果见
参数 |
a1 |
a2 |
a3 |
a4 |
a5 |
a6 |
const |
R2 |
GDP |
449.0886 |
−0.0667 |
44.6982 |
−13735.1559 |
0.1538 |
−292.3208 |
−608.8075 |
0.983 |
CPI |
46.4417 |
0.0012 |
−0.1755 |
51.2272 |
0.0002 |
0.3962 |
4.7791 |
0.535 |
根据
指标 |
GDP-泰勒规则 |
GDP-LSTM |
GDP-随机森林 |
CPI-泰勒规则 |
CPI-LSTM |
CPI-随机森林 |
RSS |
26,856,742 |
26,819,335 |
26,805,818 |
803.236 |
778.547 |
785.399 |
本研究通过对利率预测模型的精细化评估,深入探讨了泰勒规则与机器学习方法(特别是LSTM模型和随机森林模型)在宏观经济预测上的应用价值和有效性。通过对比均方根误差、均方误差、平均绝对百分比误差及平均绝对误差等关键指标,可以发现LSTM模型和随机森林模型在预测利率方面均显示出高于泰勒规则的精确度,这表明机器学习技术在处理复杂的非线性模式和数据中的潜在关系方面具有显著优势。在GDP和CPI的预测中,LSTM模型和随机森林模型所估计的GDP和CPI的残差平方和均低于泰勒规则,这进一步证实了机器学习算法在货币政策制定中的优越性能。
这一结果对制定经济战略和政策决策具有深远的影响。首先,机器学习模型在预测利率方面相对于传统的泰勒规则方法展现出明显的优势,这为制定明智的货币政策打下了坚实的基础。准确的利率预测使得政策制定者能够采取更加主动的策略来回应特定的市场状况,避免了依赖一刀切的解决方案,确保措施与市场的细微变化保持同步。其次,提升对利率变动的预测准确性有助于增进新兴经济体的金融稳定性。通过更精准地识别利率变化,政策制定者可以预先采取措施减少风险,防止金融市场的不稳定性上升,从而构建更加稳定的投资与消费环境。此外,机器学习模型通过捕捉经济数据中的复杂关系,能够更全面地分析影响利率的因素,使得政策制定者能够准确识别和应对利率变动的主导因素,并且制定针对性的政策。这种方法保证了政策的及时性,并集中于根源问题,提高了政策的效果。
但这一结果并不能完全否定泰勒规则的价值,泰勒规则建立在明确的经济理论和数学公式之上,其决策逻辑更容易理解和解释。相反,机器学习模型往往是基于大量数据的复杂计算,模型内部的权重和参数关系难以完全阐述清楚,存在“黑箱”问题。两种方法的结合或许能提供一个平衡点,结合泰勒规则的可解释性和机器学习的预测能力,为决策者提供更全面的工具。
江苏省社会科学基金项目研究成果(20EYC011);中国博士后科学基金面上资助项目成果(2021M691635)。