Prediction and Analysis of the Term Structure of Government Bond Interest Rate Based on Deep Learning
The term structure of interest rates and related issues has always been a research hotspot in finance. With the help of the dynamic Svensson model and deep learning, this paper constructs a deep learning prediction model for the term structure of treasury bond interest rates. This paper selects the yield data of inter-bank zero-interest treasury bond bonds from January 2012 to April 2024 to conduct an empirical analysis. The results show that compared with the prediction results of the DS model, the DS model with macroeconomic variables, and the deep learning model without macroeconomic variables, the deep learning prediction model proposed in this paper has significantly improved its effectiveness and has better robustness.
Term Structure of Interest Rate
为了使国民经济快速、均衡、稳健、健康地发展,近几年来,全国各级政府发行了适量的政府债券,所发行的政府债券品种也越来越丰富。特别是中国国债的管理、中国国债利率期限结构、利率期限结构一直是金融学的研究热点
动态利率期限结构模型能够从时间角度分析收益率,适应经济环境频繁更新的利率数据。2006年,Diebold
近年来,很多学者在对利率期限结构的研究中加入人工智能方法,如神经网络、遗传算法等,其中神经网络模型具有非线性性、非局限性、非常定性等特点,具有较强的学习能力,对非线性的、蕴含模糊信息的关系研究具有较好的适用性。2007年,姜德峰
2003年,Ang等
本文在李依航、Delucchi等研究的基础上,集动态Svensson模型与深度学习的优点,构建了中国国债利率期限结构混合预测模型。
基于动态Svensson模型,拟合出动态四因子,将宏观经济变量分别与
、
、
、
四个动态因子进行TVP-VAR建模,筛选出与利率期限结构预测相关的宏观经济变量。将筛选出的变量与利率期限结构一起纳入到CNN-LSTM深度学习的预测模型中,见
国债市场的交易量和托管量主要来自银行间市场,本文选取的国债数据为银行间零息国债收益率数据。很多宏观数据的频率都为月度,因此我们以每个月最后一天的即期收益率作为国债月度数据。数据选取的范围为2012年1月到2024年5月,研究的期限为1、3、6、12、24、36、60、84、120、180、240、360、600 (单位:月),即得到149 × 13个样本数据,所有数据均来自Wind数据库。
本文选取的宏观经济指标是投资者最为关注的且基本覆盖了宏观经济的主要方面。将经济指标分为5个大类、13个分项指标。
经济类:选取价格指标包括消费者价格指数(CPI)、制造业采购经理指数(PMI)、工业增加值同比(IP)。
货币类:选取狭义货币供应量(M1)、广义货币供应量(M2)和社会融资规模(TSF)。
资金类:选取银行间质押式七日回购加权利率(R007)、人民币存款准备金率(RRR)。
宏观景气类:选取宏观经济景气先行指数(MLAI)、宏观经济景气一致指数(MCI)以及宏观经济景气滞后指数(MLEI)。
外部因素类:选取剩余期限为10年的美国国债利率期限结构(America10)和美元指数(USDX)。
动态Svenson模型中的时变参数 、 、 、 以及 、 共有6个参数,在对样本数据拟合时,要先对参数进行估计,估计参数 采用卡尔曼滤波法,也就是以拟合误差平方均值最小为目标函数优化得出。
(1)
计算得出 = 0.2931,使 的载荷在剩余期限为7年时达到最大, = 0.6137使得 的载荷在剩余期限为3年时达到最大。接着在得到 值的基础上,对剩余四个参数 、 、 、 进行最小二乘法进行估计,得到动态向量 、 、 、 。
将Svensson模型中的参数因子
、
、
、
与宏观变量之间进行Pearson相关性检验,选出与因子相关性高的宏观经济变量,具体结果如
Lt |
St |
Ct1 |
Ct2 |
|
CPI |
−0.108 (0.283) |
0.009 (0.927) |
0.138 (0.172) |
−0.007 (0.944) |
PMI |
0.291 (0.003***) |
−0.064 (0.524) |
−0.107 (0.290) |
−0.008 (0.939) |
IP |
0.385 (0.000***) |
0.076 (0.454) |
0.083 (0.411) |
−0.167 (0.097*) |
M1 |
−0.396 (0.000***) |
−0.51 (0.000***) |
−0.505 (0.000***) |
0.55 (0.000***) |
M2 |
−0.433 (0.000***) |
−0.467 (0.000***) |
−0.446 (0.000***) |
0.537 (0.000***) |
TSF |
−0.195 (0.052*) |
−0.137 (0.174) |
−0.067 (0.508) |
0.166 (0.099*) |
MCI |
0.171 (0.089*) |
−0.331 (0.001***) |
−0.463 (0.000***) |
0.239 (0.017**) |
MLAI |
−0.028 (0.783) |
−0.314 (0.001***) |
−0.431 (0.000***) |
0.252 (0.011**) |
MLEI |
−0.216 (0.031**) |
−0.329 (0.001***) |
−0.232 (0.020**) |
0.287 (0.004***) |
R007 |
0.608 (0.000***) |
0.05 (0.621) |
−0.022 (0.826) |
−0.388 (0.000***) |
RRR |
0.552 (0.000***) |
0.37 (0.000***) |
0.302 (0.002***) |
−0.469 (0.000***) |
America10 |
0.599 (0.000***) |
−0.369 (0.000***) |
−0.441 (0.000***) |
0.278 (0.005***) |
USDX |
−0.672 (0.000***) |
−0.241 (0.016**) |
−0.286 (0.004***) |
0.34 (0.001***) |
注:表中数字为皮尔逊系数,()内数字为P值,***、**、*分别代表1%、5%、10%的显著性水平。
从上表结果可以看到:宏观经济变量M1、M2、MLEI、RRR、America10、USDX与四个因子 、 、 、 的显著性水平均在5%以下。
但Pearson相关性检验也存在一些局限性,若变量之间存在非线性关系,那么Pearson相关系数可能无法准确反映变量之间的真实关联,需要通过进一步的检验。
在分析各指标的相关性之前,需经过平稳性检验,检验为平稳序列,才能进行时间序列建模分析。借助EViews 13.0软件对各组数据进行ADF检验。ADF检验结果为6组数据部分为非平稳序列,见
参数 |
T统计量 |
概率(P) |
平稳性结论 |
Lt |
−1.519444 |
0.5196 |
不平稳 |
St |
−5.150992 |
0.0003 |
平稳 |
Ct1 |
−5.240649 |
0.0002 |
平稳 |
Ct2 |
−6.900654 |
0.0000 |
平稳 |
M1 |
−2.067011 |
0.5570 |
不平稳 |
M2 |
−1.442562 |
0.8410 |
不平稳 |
MLEI |
1.254534 |
0.9450 |
不平稳 |
RRR |
−3.321261 |
0.0011 |
平稳 |
America10 |
−2.177863 |
0.2157 |
不平稳 |
USDX |
−1.357658 |
0.5997 |
不平稳 |
注:概率P大于0.05不能拒绝原假设,为不平稳序列。
参数 |
T统计量 |
概率(P) |
平稳性结论 |
D(Lt) |
−9.293497 |
0.0000 |
平稳 |
D(M1) |
−12.43583 |
0.0000 |
平稳 |
D(M2) |
−8.614201 |
0.0000 |
平稳 |
D(MLEI) |
−14.04135 |
0.0000 |
平稳 |
D(America10) |
−9.950297 |
0.0000 |
平稳 |
D(USDX) |
−10.01119 |
0.0017 |
平稳 |
注:概率P大于0.05不能拒绝原假设,为不平稳序列。
借助EViews软件中的似然比(LR)检验法,分别从AIC、SC、HQ、LR、FPE五个方面来考察。表中的“*”表示最佳滞后阶数,带星号最多的滞后阶数,就是我们选择的最佳滞后阶数。因此最佳滞后阶数为1,见
Lag |
LogL |
LR |
FPE |
AIC |
SC |
HQ |
0 |
−1789.892 |
NA |
0.069528 |
25.71274 |
25.92285 |
25.79812 |
1 |
−1216.050 |
1057.508* |
8.01e−05* |
18.94357* |
21.25487* |
19.88281* |
2 |
−1151.789 |
109.2447 |
0.000136 |
19.45412 |
23.86659 |
21.24722 |
3 |
−1089.780 |
96.55673 |
0.000247 |
19.99685 |
26.51049 |
22.64380 |
4 |
−1004.286 |
120.9120 |
0.000336 |
20.20409 |
28.81890 |
23.70489 |
5 |
−930.3314 |
94.02845 |
0.000580 |
20.57616 |
31.29215 |
24.93082 |
6 |
−843.8699 |
97.57797 |
0.000926 |
20.76957 |
33.58673 |
25.97808 |
7 |
−731.9046 |
110.3658 |
0.001176 |
20.59864 |
35.51697 |
26.66100 |
8 |
−614.5220 |
98.93680 |
0.001672 |
20.35031 |
37.36982 |
27.26653 |
根据得到的最佳滞后阶数,借助OxMetrics 6软件对参数采用MCMC (马氏链–蒙特卡罗)方法进行估计,设定抽样迭代的次数是10,000次。从统计结果我们可以看到Geweke统计量均大于5%,拒绝原假设,马尔科夫链趋于集中。表中无效因子最大为61.63,也就是连续抽样10,000次能获得
个无效样本,因此上述的TVP-VAR模型的模拟效果好。估计结果如
Estimation Result |
||||||
Parameter |
Mean |
STDEV |
95% L |
95% U |
Geweke |
Inef. |
Sb1 |
0.0326 |
0.0070 |
0.0222 |
0.0492 |
0.135 |
4.84 |
Sb2 |
0.0203 |
0.0020 |
0.0168 |
0.0247 |
0.153 |
3.23 |
Sa1 |
0.0347 |
0.0080 |
0.0226 |
0.0539 |
0.326 |
27.09 |
Sa2 |
0.1527 |
0.3624 |
0.0411 |
1.0009 |
0.018 |
54.34 |
Sh1 |
0.0835 |
0.0310 |
0.0429 |
0.1662 |
0.919 |
75.44 |
Sh2 |
0.0973 |
0.0545 |
0.0428 |
0.2504 |
0.083 |
86.53 |
在TVP-VAR模型估计完成后,将初步筛选的宏观经济变量对四因子做脉冲响应分析,观察响应变量在不同冲击下的动态变化是否呈现非线性特征,例如,某些变量对冲击的响应可能在不同时间阶段表现出不同的强度或方向。并且TVP-VAR模型本身允许系数随时间变化,这种时变性就反映了变量之间关系的非线性特征,通过分析脉冲响应函数在不同时期的变化,可以做进一步动态分析。
图2. 宏观经济变量对水平因子L的脉冲响应图
图3. 宏观经济变量对斜率因子S的脉冲响应图
图4. 宏观经济变量对曲率因子C1的脉冲响应图
图5. 宏观经济变量对曲率因子C2的脉冲响应图
综上,M1和M2对四因子的冲击图存在高度的相似性,两者都代表货币量这一经济含义,但M1对四因子的冲击更为敏感;MLEI作为宏观经济指标,受社会的经济变动更为明显,对四因子的冲击也多为正向冲击,与利率期限结构联系密切;RRR作为货币政策工具,对四因子的冲击会受到经济状况的影响而减弱;America10与USDX作为外部因素对四因子的冲击,存在相似性,但America10对四因子的冲击更为敏感。M1、MLEI、RRR、America10四个变量与利率期限结构联系更为密切,更具代表性,因此,将M1、MLEI、RRR、America10四个宏观经济变量纳入到利率期限结构的预测中去。
将筛选出的宏观经济变量M1、MLEI、RRR、America10作为新的变量加入到输入集中,卷积神经网络(CNN)可以提取输入数据的特征,再经过长短时记忆网络(LSTM)学习这些特征,对数据集做出预测。
在输入数据之前要先对数据进行归一化处理,
(2)
处理后的数据划分为训练集和测试集,并通过实验对神经网络各个参数进行设置,经过实验将MiniBatchSize设置为128,MaxEpochs设置为500,学习率设置为0.01等等,训练混合网络。
模型的预测效果用均方误差(RMSE)来检验,从下
(3)
从
图6. 剩余期限为1月、60个月、600个月的测试集预测结果
Maturities (month) |
DS |
DS(加入宏观经济变量) |
CNN-LSTM |
CNN-LSTM (加入宏观经济变量) |
1 |
0.14154 |
0.24636 |
0.13451 |
0.05782 |
3 |
0.10225 |
0.16992 |
0.12131 |
0.03421 |
6 |
0.10375 |
0.10347 |
0.12853 |
0.03076 |
12 |
0.10999 |
0.10021 |
0.11068 |
0.02163 |
24 |
0.10021 |
0.09651 |
0.08634 |
0.02109 |
36 |
0.07923 |
0.07097 |
0.06581 |
0.01577 |
60 |
0.10442 |
0.07035 |
0.07782 |
0.03068 |
84 |
0.13163 |
0.06741 |
0.05203 |
0.02041 |
120 |
0.26679 |
0.08152 |
0.0991 |
0.02931 |
180 |
0.11989 |
0.07112 |
0.10985 |
0.03841 |
240 |
0.08541 |
0.06409 |
0.09469 |
0.04465 |
360 |
0.12346 |
0.09615 |
0.12364 |
0.05891 |
600 |
0.26547 |
0.10586 |
0.16457 |
0.06852 |
不如DS模型,可能是由于短期收益率的影响因素比较多,情况相对复杂,加入宏观经济变量反而没有提高预测能力。从中长期来看,加入宏观经济变量的DS模型预测效果还是有所提高。通过CNN-LSTM模型拟合的RMSE值来看,几乎都是呈现出先下降再上升的趋势,大概在剩余期限为36个月至84个月间误差最小,在这个期限范围内模型的拟合效果最佳。同时这也与我们前文假设 会使得 的载荷在剩余期限为7年时取得最大, 会使得 在剩余期限为3年时达到最大相契合。综上,通过对比各个模型的RMSE值,加入宏观经济变量的CNN-LSTM模型的预测效果更好,尤其是中期预测。
补充确定系数( )、平均绝对误差(MAE)两个指标来检验,更全面地评估模型的拟合能力和预测精度。
(4)
(5)
Maturities (month) |
DS |
DS(加入宏观经济变量) |
CNN-LSTM |
CNN-LSTM(加入宏观经济变量) |
1 |
0.94539 |
0.88325 |
0.97445 |
0.98397 |
3 |
0.97312 |
0.94723 |
0.97347 |
0.98855 |
6 |
0.96119 |
0.95294 |
0.98891 |
0.98354 |
12 |
0.98426 |
0.97461 |
0.99257 |
0.99805 |
24 |
0.98025 |
0.96131 |
0.99759 |
0.99520 |
36 |
0.98618 |
0.97335 |
0.99354 |
0.99849 |
60 |
0.98866 |
0.98316 |
0.93749 |
0.99432 |
84 |
0.98578 |
0.90691 |
0.97146 |
0.99673 |
120 |
0.97062 |
0.60369 |
0.95676 |
0.99582 |
180 |
0.95312 |
0.92375 |
0.98526 |
0.98479 |
240 |
0.96119 |
0.97642 |
0.98865 |
0.98283 |
360 |
0.95143 |
0.86455 |
0.97303 |
0.97841 |
600 |
0.95025 |
0.62071 |
0.96183 |
0.96548 |
从
Maturities (month) |
DS |
DS(加入宏观经济变量) |
CNN-LSTM |
CNN-LSTM(加入宏观经济变量) |
1 |
0.15834 |
0.19353 |
0.05712 |
0.04419 |
3 |
0.07708 |
0.13278 |
0.03898 |
0.03983 |
6 |
0.09091 |
0.12732 |
0.02967 |
0.03342 |
12 |
0.09977 |
0.10504 |
0.02617 |
0.01458 |
24 |
0.08965 |
0.09467 |
0.01789 |
0.01814 |
36 |
0.04232 |
0.08790 |
0.02971 |
0.01538 |
60 |
0.09137 |
0.06481 |
0.04569 |
0.03121 |
84 |
0.12221 |
0.06393 |
0.01901 |
0.01897 |
120 |
0.26191 |
0.07014 |
0.04789 |
0.18699 |
180 |
0.10112 |
0.06103 |
0.03291 |
0.04016 |
240 |
0.05695 |
0.05313 |
0.03915 |
0.02382 |
360 |
0.14656 |
0.08047 |
0.03342 |
0.03427 |
600 |
0.25332 |
0.07982 |
0.05237 |
0.02999 |
MAE可以提供一个直观的误差量度,帮助理解模型在实际应用中的表现,MAE数值越低,说明模型的预测值与真实值之间的平均绝对偏差越小,模型的预测精度越高,从
为验证CNN-LSTM模型的稳健性,将符合正态分布、均值为0、方差为0.05的噪声添加至国债利率期限结构数据中,加噪后剩余期限为1月的预测结果见
加噪后模型RMSE为0.053206,证实本文模型在加噪数据上也能表现良好,说明模型鲁棒性高,具有更好的稳健性,可以更好地应对现实世界中的不确定性和变化性。
1) 构建了融入金融知识的中国国债利率期限结构深度学习预测模型。与DS模型、加入宏观经济变量的DS模型、不加入宏观经济变量的CNN-LSTM模型的预测结果进行对比,实证结果显示本文提出的融入金融知识的模型预测效果显著提升,鲁棒性更好。
2) 基于动态Svensson模型,利用Pearson相关性检验,初步筛选出与动态Svensson模型中四个动态因子 、 、 、 相关性强的宏观经济变量;建立了TVP-VAR模型,并从冲击方向和冲击强度两个方面,分析了宏观经济变量对四个动态因子的影响。本文数据选取的范围为2012年1月到2024年5月内,M1、MLEI、RRR、America10四个变量与利率期限结构联系更为密切,更具代表性。
国家自然科学基金(51675161)资助项目。
*通讯作者。