1. 引言
为了使国民经济快速、均衡、稳健、健康地发展,近几年来,全国各级政府发行了适量的政府债券,所发行的政府债券品种也越来越丰富。特别是中国国债的管理、中国国债利率期限结构、利率期限结构一直是金融学的研究热点[1]-[3]。现代利率期限结构模型按照其模型因子的状态,可分为静态利率期限结构模型、动态利率期限结构模型。静态利率期限结构模型常见的有:1971年McCulloch [4]提出的多项式样条法;1980年Powell [5]给出的B-样条法;1987年,Nelson和Seigel [6]构建的包含水平、斜率、曲度三因子的即期利率函数表达式,即NS模型;随后在1994年,Svensson [7]在NS模型的基础上增加了一个因子,得到四因子模型,即NSS模型。NS模型和NSS模型均具有拟合能力强、参数估计方法简单和普适性优良等优点。2003年,赵宇龄[8]对多种利率期限结构预测模型进行了对比,发现Nelson-Siegel模型、扩展的Svensson模型在拟合中债国债利率期限结构时较为准确。2006年,郭济敏[9]不仅将NS模型应用于中国国债利率期限结构的预测,还详细讨论了不同参数的经济含义。
动态利率期限结构模型能够从时间角度分析收益率,适应经济环境频繁更新的利率数据。2006年,Diebold [10]首次尝试在静态Nelson-Siegel模型中加入三个动态因子,得到了动态Nelson-Siegel模型(DNS模型),基于DNS模型,对美国国债收益率进行了预测,对比发现,DNS预测准确度较静态NS模型高。2015年,Nyholm [11]在DNS模型的基础上,提出了RDNS模型,并借助此模型,对欧洲中央银行收益率进行了预测,预测效果良好。2014年,何晓群等[12]基于DNS模型,对中国国债利率期限结构进行了拟合,拟合效果良好,这说明了DNS模型在拟合中国国债收益率时,具有良好的适用性。
近年来,很多学者在对利率期限结构的研究中加入人工智能方法,如神经网络、遗传算法等,其中神经网络模型具有非线性性、非局限性、非常定性等特点,具有较强的学习能力,对非线性的、蕴含模糊信息的关系研究具有较好的适用性。2007年,姜德峰[13]对于利率期限结构模型建造,则以支持向量机的方式建立相应利率模型。也可以将传统预测方法与人工智能方法结合起来,2010年,董皓舒[14]将指数函数模型与BP神经网络结合起来,构建组合模型对利率期限结构进行预测,研究发现这种方法的预测效果优于两者分别单独用于预测的效果。2018年,李佳等[15]使用上证指数及沪深300指数,对ARMA、RNN、CNN以及LSTM神经网络等方法的预测效果进行对比分析,分析结果显示,LSTM神经网络方法的预测误差最低,预测最为精准。LSTM神经网络预测能够弥补BP神经网络时序欠缺、梯度容易消失等方面的缺陷。2018年,任君[16]将四种不同的LSTM模型用于对道琼斯指数的预测,结果显示,弹性网正则化LSTM的预测效果最好,该模型的泛化能力强于RNN以及传统的BP神经网络模型。2022年,Kauffmann等[17]基于巴西利率期限结构实证分析,提出一种利用神经网络的收益率曲线预测模型,样本的预测效果优于传统方法,尤其是在较长期限中。2023年,Delucchi等[18]认为使用机器学习的方法能够更好地说明疫情危机、俄乌战争等社会危机,以及导致的收益率曲线异常现象。
2003年,Ang等[19]提出了含宏观经济变量的利率期限结构模型,使用VAR模型,研究了宏观经济变量和利率期限结构因子之间的动态关系。2006年,Diebold等[10]通过检验通货膨胀等宏观经济变量与利率期限结构三因子之间的动态联系,得出了宏观经济影响未来利率期限结构,利率期限结构曲线对未来宏观经济影响较弱的结论。2016年,Levant等[20]采用DNS模型,拟合预测英国国债利率期限结构,并研究了宏观经济变量对利率期限结构的影响,结果发现,宏观经济变量对利率期限结构的影响会随着剩余期限的变化而变化。国内学者袁靖等[21]、巴曙松等[22]以及李雪等[23]均发现利率期限结构与宏观经济变量之间存在联系。2014年,金雯雯等[24]研究利率期限结构时,考虑了宏观经济变量,建立了时变参数向量自回归模型(TVP-VAR模型),结果表明,利率期限结构与宏观经济之间的关系存在时变性和滞后性。2022年,李依航等[25]从宏观经济变量中提取主成分信息,将主成分信息纳入NS模型中,对利率期限结构进行预测,为制定经济政策和投资策略提供参考。
本文在李依航、Delucchi等研究的基础上,集动态Svensson模型与深度学习的优点,构建了中国国债利率期限结构混合预测模型。
2. 模型构建
基于动态Svensson模型,拟合出动态四因子,将宏观经济变量分别与
、
、
、
四个动态因子进行TVP-VAR建模,筛选出与利率期限结构预测相关的宏观经济变量。将筛选出的变量与利率期限结构一起纳入到CNN-LSTM深度学习的预测模型中,见图1。
Figure 1. Deep learning prediction model
图1. 深度学习预测模型
3. 实证分析
3.1. 数据选取
国债市场的交易量和托管量主要来自银行间市场,本文选取的国债数据为银行间零息国债收益率数据。很多宏观数据的频率都为月度,因此我们以每个月最后一天的即期收益率作为国债月度数据。数据选取的范围为2012年1月到2024年5月,研究的期限为1、3、6、12、24、36、60、84、120、180、240、360、600 (单位:月),即得到149 × 13个样本数据,所有数据均来自Wind数据库。
3.2. 宏观经济变量选取
本文选取的宏观经济指标是投资者最为关注的且基本覆盖了宏观经济的主要方面。将经济指标分为5个大类、13个分项指标。
经济类:选取价格指标包括消费者价格指数(CPI)、制造业采购经理指数(PMI)、工业增加值同比(IP)。
货币类:选取狭义货币供应量(M1)、广义货币供应量(M2)和社会融资规模(TSF)。
资金类:选取银行间质押式七日回购加权利率(R007)、人民币存款准备金率(RRR)。
宏观景气类:选取宏观经济景气先行指数(MLAI)、宏观经济景气一致指数(MCI)以及宏观经济景气滞后指数(MLEI)。
外部因素类:选取剩余期限为10年的美国国债利率期限结构(America10)和美元指数(USDX)。
3.3. 参数估计
动态Svenson模型中的时变参数
、
、
、
以及
、
共有6个参数,在对样本数据拟合时,要先对参数进行估计,估计参数
采用卡尔曼滤波法,也就是以拟合误差平方均值最小为目标函数优化得出。
(1)
计算得出
= 0.2931,使
的载荷在剩余期限为7年时达到最大,
= 0.6137使得
的载荷在剩余期限为3年时达到最大。接着在得到
值的基础上,对剩余四个参数
、
、
、
进行最小二乘法进行估计,得到动态向量
、
、
、
。
3.4. Pearson相关性检验
将Svensson模型中的参数因子
、
、
、
与宏观变量之间进行Pearson相关性检验,选出与因子相关性高的宏观经济变量,具体结果如表1所示:
Table 1. Correlation test between various factors and macroeconomic variables
表1. 各因子与宏观经济变量的相关性检验
|
Lt |
St |
Ct1 |
Ct2 |
CPI |
−0.108 (0.283) |
0.009 (0.927) |
0.138 (0.172) |
−0.007 (0.944) |
PMI |
0.291 (0.003***) |
−0.064 (0.524) |
−0.107 (0.290) |
−0.008 (0.939) |
IP |
0.385 (0.000***) |
0.076 (0.454) |
0.083 (0.411) |
−0.167 (0.097*) |
M1 |
−0.396 (0.000***) |
−0.51 (0.000***) |
−0.505 (0.000***) |
0.55 (0.000***) |
M2 |
−0.433 (0.000***) |
−0.467 (0.000***) |
−0.446 (0.000***) |
0.537 (0.000***) |
TSF |
−0.195 (0.052*) |
−0.137 (0.174) |
−0.067 (0.508) |
0.166 (0.099*) |
MCI |
0.171 (0.089*) |
−0.331 (0.001***) |
−0.463 (0.000***) |
0.239 (0.017**) |
MLAI |
−0.028 (0.783) |
−0.314 (0.001***) |
−0.431 (0.000***) |
0.252 (0.011**) |
MLEI |
−0.216 (0.031**) |
−0.329 (0.001***) |
−0.232 (0.020**) |
0.287 (0.004***) |
R007 |
0.608 (0.000***) |
0.05 (0.621) |
−0.022 (0.826) |
−0.388 (0.000***) |
RRR |
0.552 (0.000***) |
0.37 (0.000***) |
0.302 (0.002***) |
−0.469 (0.000***) |
America10 |
0.599 (0.000***) |
−0.369 (0.000***) |
−0.441 (0.000***) |
0.278 (0.005***) |
USDX |
−0.672 (0.000***) |
−0.241 (0.016**) |
−0.286 (0.004***) |
0.34 (0.001***) |
注:表中数字为皮尔逊系数,()内数字为P值,***、**、*分别代表1%、5%、10%的显著性水平。
从上表结果可以看到:宏观经济变量M1、M2、MLEI、RRR、America10、USDX与四个因子
、
、
、
的显著性水平均在5%以下。
但Pearson相关性检验也存在一些局限性,若变量之间存在非线性关系,那么Pearson相关系数可能无法准确反映变量之间的真实关联,需要通过进一步的检验。
3.5. TVP-VAR建模分析
3.5.1. ADF检验
在分析各指标的相关性之前,需经过平稳性检验,检验为平稳序列,才能进行时间序列建模分析。借助EViews 13.0软件对各组数据进行ADF检验。ADF检验结果为6组数据部分为非平稳序列,见表2,因此对这部分数据进行一阶差分处理,使这6组时间序列数据成为平稳序列,见表3。
Table 2. ADF test results of various factors and macroeconomic variable sequences
表2. 各因子和宏观经济变量序列的ADF检验结果
参数 |
T统计量 |
概率(P) |
平稳性结论 |
Lt |
−1.519444 |
0.5196 |
不平稳 |
St |
−5.150992 |
0.0003 |
平稳 |
Ct1 |
−5.240649 |
0.0002 |
平稳 |
Ct2 |
−6.900654 |
0.0000 |
平稳 |
M1 |
−2.067011 |
0.5570 |
不平稳 |
M2 |
−1.442562 |
0.8410 |
不平稳 |
MLEI |
1.254534 |
0.9450 |
不平稳 |
RRR |
−3.321261 |
0.0011 |
平稳 |
America10 |
−2.177863 |
0.2157 |
不平稳 |
USDX |
−1.357658 |
0.5997 |
不平稳 |
注:概率P大于0.05不能拒绝原假设,为不平稳序列。
Table 3. ADF test results of various factors and macroeconomic variable sequences after first-order differencing
表3. 一阶差分后各因子和宏观经济变量序列的ADF检验结果
参数 |
T统计量 |
概率(P) |
平稳性结论 |
D(Lt) |
−9.293497 |
0.0000 |
平稳 |
D(M1) |
−12.43583 |
0.0000 |
平稳 |
D(M2) |
−8.614201 |
0.0000 |
平稳 |
D(MLEI) |
−14.04135 |
0.0000 |
平稳 |
D(America10) |
−9.950297 |
0.0000 |
平稳 |
D(USDX) |
−10.01119 |
0.0017 |
平稳 |
注:概率P大于0.05不能拒绝原假设,为不平稳序列。
3.5.2. 确定滞后阶数
借助EViews软件中的似然比(LR)检验法,分别从AIC、SC、HQ、LR、FPE五个方面来考察。表中的“*”表示最佳滞后阶数,带星号最多的滞后阶数,就是我们选择的最佳滞后阶数。因此最佳滞后阶数为1,见表4。
Table 4. Estimation results of lag factor P
表4. 滞后因子P的估计结果
Lag |
LogL |
LR |
FPE |
AIC |
SC |
HQ |
0 |
−1789.892 |
NA |
0.069528 |
25.71274 |
25.92285 |
25.79812 |
1 |
−1216.050 |
1057.508* |
8.01e−05* |
18.94357* |
21.25487* |
19.88281* |
2 |
−1151.789 |
109.2447 |
0.000136 |
19.45412 |
23.86659 |
21.24722 |
3 |
−1089.780 |
96.55673 |
0.000247 |
19.99685 |
26.51049 |
22.64380 |
4 |
−1004.286 |
120.9120 |
0.000336 |
20.20409 |
28.81890 |
23.70489 |
5 |
−930.3314 |
94.02845 |
0.000580 |
20.57616 |
31.29215 |
24.93082 |
6 |
−843.8699 |
97.57797 |
0.000926 |
20.76957 |
33.58673 |
25.97808 |
7 |
−731.9046 |
110.3658 |
0.001176 |
20.59864 |
35.51697 |
26.66100 |
8 |
−614.5220 |
98.93680 |
0.001672 |
20.35031 |
37.36982 |
27.26653 |
3.5.3. MCMC参数估计
根据得到的最佳滞后阶数,借助OxMetrics 6软件对参数采用MCMC (马氏链–蒙特卡罗)方法进行估计,设定抽样迭代的次数是10,000次。从统计结果我们可以看到Geweke统计量均大于5%,拒绝原假设,马尔科夫链趋于集中。表中无效因子最大为61.63,也就是连续抽样10,000次能获得
个无效样本,因此上述的TVP-VAR模型的模拟效果好。估计结果如表5所示。
Table 5. Estimation results of TVP-VAR model
表5. TVP-VAR模型估计结果
Estimation Result |
Parameter |
Mean |
STDEV |
95% L |
95% U |
Geweke |
Inef. |
Sb1 |
0.0326 |
0.0070 |
0.0222 |
0.0492 |
0.135 |
4.84 |
Sb2 |
0.0203 |
0.0020 |
0.0168 |
0.0247 |
0.153 |
3.23 |
Sa1 |
0.0347 |
0.0080 |
0.0226 |
0.0539 |
0.326 |
27.09 |
Sa2 |
0.1527 |
0.3624 |
0.0411 |
1.0009 |
0.018 |
54.34 |
Sh1 |
0.0835 |
0.0310 |
0.0429 |
0.1662 |
0.919 |
75.44 |
Sh2 |
0.0973 |
0.0545 |
0.0428 |
0.2504 |
0.083 |
86.53 |
3.5.4. 脉冲响应分析
在TVP-VAR模型估计完成后,将初步筛选的宏观经济变量对四因子做脉冲响应分析,观察响应变量在不同冲击下的动态变化是否呈现非线性特征,例如,某些变量对冲击的响应可能在不同时间阶段表现出不同的强度或方向。并且TVP-VAR模型本身允许系数随时间变化,这种时变性就反映了变量之间关系的非线性特征,通过分析脉冲响应函数在不同时期的变化,可以做进一步动态分析。
图2中M1对水平因子L多为负向冲击,2021年之后开始变为正向冲击;M2对L的正向冲击和负向冲击时间差不多;MLEI对L的正向冲击较多,且冲击强度大;RRR对L的冲击强度较小,但从2023年之后,负向冲击急剧增大;America10对L的冲击在2022年之前多为负向冲击,但在2023年正向冲击急剧增大;USDX对L的冲击从2023年开始,正向冲击急剧增大。
(a) (b)
(c) (d)
(e) (f)
Figure 2. Pulse response diagram of macroeconomic variables to horizontal factor L
图2. 宏观经济变量对水平因子L的脉冲响应图
(a) (b)
(c) (d)
(e) (f)
Figure 3. Pulse response diagram of macroeconomic variables to slope factor S
图3. 宏观经济变量对斜率因子S的脉冲响应图
图3中M1对斜率因子S多为负向冲击,且冲击强度较大;M2对S多为负向冲击,且冲击强度较大;MLEI对S的冲击强度在2018年至2023年为正向冲击,且冲击强度较大,其余时间冲击强度在0周围浮动;RRR对S多为负向冲击,冲击强度越来越小;America10对S在2015至2020年为负向冲击,且冲击强度较大,其余时间冲击强度在0周围浮动;USDX对S在2018年至2020年为负向冲击,且强度较大。
图4中M1对曲率因子C1为正向冲击,且冲击的波动性较大;M2对C1为正向冲击,在2019年10月冲击强度最大;MLEI对C1的冲击强度在0周围浮动,在2017年转为正向冲击,在2019年达到最大值;RRR对C1为负向冲击,且冲击强度不断减小;America10对C1在2015年至2019年多为负向冲击;USDX对C1的冲击方向不是很稳定。
(a) (b)
(c) (d)
(e) (f)
Figure 4. Pulse response diagram of macroeconomic variables to curvature factor C1
图4. 宏观经济变量对曲率因子C1的脉冲响应图
(a) (b)
(c) (d)
(e) (f)
Figure 5. Pulse response diagram of macroeconomic variables to curvature factor C2
图5. 宏观经济变量对曲率因子C2的脉冲响应图
图5中M1对曲率因子C2冲击的方向多变,在2018年变为负向冲击,且冲击强度不断增大;M2对C2多为负向冲击,且在2019年9月负向冲击强度达到最大;MLEI对C2在2017年至2022年为负向冲击,且冲击强度较大;RRR对C2为正向冲击,冲击强度不断减小;America10对C2为正向冲击,在2014年冲击强度最大,随后不断减小;USDX对C2在2015年短暂地出现过负向冲击,后来冲击强度越来越小。
综上,M1和M2对四因子的冲击图存在高度的相似性,两者都代表货币量这一经济含义,但M1对四因子的冲击更为敏感;MLEI作为宏观经济指标,受社会的经济变动更为明显,对四因子的冲击也多为正向冲击,与利率期限结构联系密切;RRR作为货币政策工具,对四因子的冲击会受到经济状况的影响而减弱;America10与USDX作为外部因素对四因子的冲击,存在相似性,但America10对四因子的冲击更为敏感。M1、MLEI、RRR、America10四个变量与利率期限结构联系更为密切,更具代表性,因此,将M1、MLEI、RRR、America10四个宏观经济变量纳入到利率期限结构的预测中去。
3.6. CNN-LSTM神经网络预测
将筛选出的宏观经济变量M1、MLEI、RRR、America10作为新的变量加入到输入集中,卷积神经网络(CNN)可以提取输入数据的特征,再经过长短时记忆网络(LSTM)学习这些特征,对数据集做出预测。
在输入数据之前要先对数据进行归一化处理,
(2)
处理后的数据划分为训练集和测试集,并通过实验对神经网络各个参数进行设置,经过实验将MiniBatchSize设置为128,MaxEpochs设置为500,学习率设置为0.01等等,训练混合网络。
模型的预测效果用均方误差(RMSE)来检验,从下图6中我们可以清楚地看到,剩余期限为1月(短期)、60个月(中期)、600个月(长期)的CNN-LSTM训练模型的效果准确,其中中期预测最为准确,短期次之。
(3)
从表6的对比结果可以发现:新加入宏观经济变量这一约束条件后,模型的拟合误差都有不同程度的减小,拟合精度更高。但对比DS模型加入宏观经济变量预测后,剩余期限1月、3月的预测精度还
(a)
(b) (c)
Figure 6. Prediction results of test sets with remaining maturities of 1 month, 60 months, and 600 months
图6. 剩余期限为1月、60个月、600个月的测试集预测结果
Table 6. RMSE comparison of various model test sets before and after adding macroeconomic variables
表6. 加入宏观经济变量前后各模型测试集的RMSE对比
Maturities (month) |
DS |
DS (加入宏观经济变量) |
CNN-LSTM |
CNN-LSTM (加入宏观经济变量) |
1 |
0.14154 |
0.24636 |
0.13451 |
0.05782 |
3 |
0.10225 |
0.16992 |
0.12131 |
0.03421 |
6 |
0.10375 |
0.10347 |
0.12853 |
0.03076 |
12 |
0.10999 |
0.10021 |
0.11068 |
0.02163 |
24 |
0.10021 |
0.09651 |
0.08634 |
0.02109 |
36 |
0.07923 |
0.07097 |
0.06581 |
0.01577 |
60 |
0.10442 |
0.07035 |
0.07782 |
0.03068 |
84 |
0.13163 |
0.06741 |
0.05203 |
0.02041 |
120 |
0.26679 |
0.08152 |
0.0991 |
0.02931 |
180 |
0.11989 |
0.07112 |
0.10985 |
0.03841 |
240 |
0.08541 |
0.06409 |
0.09469 |
0.04465 |
360 |
0.12346 |
0.09615 |
0.12364 |
0.05891 |
600 |
0.26547 |
0.10586 |
0.16457 |
0.06852 |
不如DS模型,可能是由于短期收益率的影响因素比较多,情况相对复杂,加入宏观经济变量反而没有提高预测能力。从中长期来看,加入宏观经济变量的DS模型预测效果还是有所提高。通过CNN-LSTM模型拟合的RMSE值来看,几乎都是呈现出先下降再上升的趋势,大概在剩余期限为36个月至84个月间误差最小,在这个期限范围内模型的拟合效果最佳。同时这也与我们前文假设
会使得
的载荷在剩余期限为7年时取得最大,
会使得
在剩余期限为3年时达到最大相契合。综上,通过对比各个模型的RMSE值,加入宏观经济变量的CNN-LSTM模型的预测效果更好,尤其是中期预测。
补充确定系数(
)、平均绝对误差(MAE)两个指标来检验,更全面地评估模型的拟合能力和预测精度。
(4)
(5)
Table 7. Comparison of R2 values of various model test sets before and after adding macroeconomic variables
表7. 加入宏观经济变量前后各模型测试集的R2对比
Maturities (month) |
DS |
DS (加入宏观经济变量) |
CNN-LSTM |
CNN-LSTM(加入宏观经济变量) |
1 |
0.94539 |
0.88325 |
0.97445 |
0.98397 |
3 |
0.97312 |
0.94723 |
0.97347 |
0.98855 |
6 |
0.96119 |
0.95294 |
0.98891 |
0.98354 |
12 |
0.98426 |
0.97461 |
0.99257 |
0.99805 |
24 |
0.98025 |
0.96131 |
0.99759 |
0.99520 |
36 |
0.98618 |
0.97335 |
0.99354 |
0.99849 |
60 |
0.98866 |
0.98316 |
0.93749 |
0.99432 |
84 |
0.98578 |
0.90691 |
0.97146 |
0.99673 |
120 |
0.97062 |
0.60369 |
0.95676 |
0.99582 |
180 |
0.95312 |
0.92375 |
0.98526 |
0.98479 |
240 |
0.96119 |
0.97642 |
0.98865 |
0.98283 |
360 |
0.95143 |
0.86455 |
0.97303 |
0.97841 |
600 |
0.95025 |
0.62071 |
0.96183 |
0.96548 |
从表7中对比结果可以看到:CNN-LSTM (加入宏观经济变量)的
值最接近于1,说明该模型预测效果最好。从表中可以看到短期、中期的
值更大,预测效果更好,优于长期。加入宏观经济变量的预测其预测精度都有不同程度的提高,说明本文提出的CNN-LSTM (加入宏观经济变量)模型对数据的拟合度高。
Table 8. Comparison of MAE of each model test set before and after adding macroeconomic variables
表8. 加入宏观经济变量前后各模型测试集的MAE对比
Maturities (month) |
DS |
DS (加入宏观经济变量) |
CNN-LSTM |
CNN-LSTM(加入宏观经济变量) |
1 |
0.15834 |
0.19353 |
0.05712 |
0.04419 |
3 |
0.07708 |
0.13278 |
0.03898 |
0.03983 |
6 |
0.09091 |
0.12732 |
0.02967 |
0.03342 |
12 |
0.09977 |
0.10504 |
0.02617 |
0.01458 |
24 |
0.08965 |
0.09467 |
0.01789 |
0.01814 |
36 |
0.04232 |
0.08790 |
0.02971 |
0.01538 |
60 |
0.09137 |
0.06481 |
0.04569 |
0.03121 |
84 |
0.12221 |
0.06393 |
0.01901 |
0.01897 |
120 |
0.26191 |
0.07014 |
0.04789 |
0.18699 |
180 |
0.10112 |
0.06103 |
0.03291 |
0.04016 |
240 |
0.05695 |
0.05313 |
0.03915 |
0.02382 |
360 |
0.14656 |
0.08047 |
0.03342 |
0.03427 |
600 |
0.25332 |
0.07982 |
0.05237 |
0.02999 |
MAE可以提供一个直观的误差量度,帮助理解模型在实际应用中的表现,MAE数值越低,说明模型的预测值与真实值之间的平均绝对偏差越小,模型的预测精度越高,从表8中对比结果看到:在中短期预测中,加入宏观经济变量后的CNN-LSTM模型的MAE值降低,显示出更好的预测性能,如果目标是进行短期或中期预测,加入宏观经济变量后的CNN-LSTM模型可能是更好的选择。对于长期预测,DS模型的预测也很准确,因此长期预测需要更仔细地考虑宏观经济变量的加入是否有助于提高模型性能,对比选择更加适合的预测模型。
3.7. 稳健性检验
为验证CNN-LSTM模型的稳健性,将符合正态分布、均值为0、方差为0.05的噪声添加至国债利率期限结构数据中,加噪后剩余期限为1月的预测结果见图7。
加噪后模型RMSE为0.053206,证实本文模型在加噪数据上也能表现良好,说明模型鲁棒性高,具有更好的稳健性,可以更好地应对现实世界中的不确定性和变化性。
4. 结论
1) 构建了融入金融知识的中国国债利率期限结构深度学习预测模型。与DS模型、加入宏观经济变量的DS模型、不加入宏观经济变量的CNN-LSTM模型的预测结果进行对比,实证结果显示本文提出的融入金融知识的模型预测效果显著提升,鲁棒性更好。
Figure 7. Prediction results of the test set with a remaining period of 1 month after adding noise
图7. 加噪后剩余期限为1月的测试集预测结果
2) 基于动态Svensson模型,利用Pearson相关性检验,初步筛选出与动态Svensson模型中四个动态因子
、
、
、
相关性强的宏观经济变量;建立了TVP-VAR模型,并从冲击方向和冲击强度两个方面,分析了宏观经济变量对四个动态因子的影响。本文数据选取的范围为2012年1月到2024年5月内,M1、MLEI、RRR、America10四个变量与利率期限结构联系更为密切,更具代表性。
基金项目
国家自然科学基金(51675161)资助项目。
NOTES
*通讯作者。