1. 引言
金融时间序列预测在金融领域至关重要,其准确性对于经济政策制定者和投资者意义非凡,既能助力经济决策,又能帮助投资者把握机遇、防范风险[1]。但金融市场的复杂多变,使得时间序列数据夹杂着随机噪声与非线性关系,给预测模型构建带来难题。在当今复杂多变的金融市场环境下,黄金作为一种重要的避险资产,其价格走势备受投资者与经济决策者关注,准确预测黄金价格不仅能为投资策略制定提供关键指引,还对宏观经济稳定研判意义非凡。
金融时间序列预测的研究方法从统计模型发展到智能模型,并逐步从单一模型扩展到组合模型。典型统计模型如ARIMA和GARCH应用广泛。例如,ARIMA与多层感知器(MLPs)结合,用于预测标准普尔500指数、深证成分股指数和道琼斯指数,展现了组合模型的潜力[2]。对比改进的GARCH族模型在股票市场预测中的准确性等性能[3]。随着计算技术的飞速进步,以人工神经网络(ANN)为核心的智能化方法逐渐崭露头角。这类方法在处理不完整、模糊或无明显规律的数据时表现优异,尤其在捕捉非线性关系方面具有显著优势。此外,以反向传播神经网络(BPNN)为基础的浅层网络结构[4],以及支持向量机(SVM)等经典机器学习算法[5],也在金融市场预测中得到了广泛采用。
早期,何树红等(2014)指出ARIMA、ARMA、GARCH等传统时间序列方法常用于股票价格预测,通过分析历史数据特征来捕捉价格走势规律[6]。ARIMA模型通过对历史数据建模,拟合时间序列数据的变动规律,进而预测未来股票的变化[7]。之后,随着技术与理论的推进,机器学习和深度学习方法兴起[8],李丽萍等(2023)以云南旅游股票数据构建LSTM神经网络模型,相比BP和Elman神经网络模型,其预测误差更小、结果更准、拟合度更高,能更好捕捉股价动态变化[9]。姜淑瑜(2024)根据股票市场的特点和LSTM递归神经网络的特性,对股价进行预测,实验结果表明,LSTM模型预测股价,结果误差小,精准度高,具有良好的预测效果[10]。
传统的ARIMA等统计模型虽应用广泛,却受数据平稳性限制且易丢失信息,而LSTM等深度学习模型随人工智能发展,在处理非线性关系上展现优势,徐卫泽(2020)比较了ARIMA模型和LSTM模型,并得出结论LSTM模型的准确性优于ARIMA模型[11]。不过单一模型难以全面应对金融数据的复杂特性,促使组合模型成为研究热点。次必聪等(2022)则选取多种金融指数构建非线性ARIMA-LSTM组合模型,在不同预测区间对金融时间序列进行分析,提供了新途径[12]。
综上,现有股票价格预测方法各有利弊,ARIMA-LSTM模型融合了传统与深度学习优势,在金融时间序列价格预测中颇具潜力,为本研究基于该模型预测时间序列价格奠定了理论与实践基础,本文也正是在此背景下,针对当前组合模型的不足,提出创新的非线性ARIMA-LSTM组合模型,充分发挥二者优势,实现对黄金价格走势的高精度预测,并通过与单一及传统线性组合模型对比实证分析其预测性能,为金融决策开拓新思路,推动金融预测领域发展。
2. 相关理论和模型介绍
(一) ARIMA模型
ARIMA模型是一种强大的时间序列分析工具,适用于无明显季节性波动的时间序列预测,通过对时间序列进行自回归(p)、差分(d)和滑动平均处理(q),ARIMA模型能够有效捕捉数据中的趋势和随机波动,从而提供可靠的预测结果,在实际应用中,ARIMA的优势在于其灵活性和可解释性,使其成为时间序列建模的经典方法之一。ARIMA模型如下:
(1)
其中
为当期随机干扰;B为延迟算子;
;xt为过去的序列值。
为p阶自回归系数多项式;
为q阶移动平滑系数多项式。
ARIMA模型的构建通常涉及几个步骤,一是检查数据的平稳性,必要时进行差分操作;二是通过自相关函数和偏自相关函数图来确定模型的阶数p、d、q;三是使用最大似然估计或最小二乘法等方法来估计模型的参数;四是检验残差是否符合白噪声的假设,以验证模型的有效性。具体流程如图1:
Figure 1. The ARIMA modeling process
图1. ARIMA建模流程
(二) LSTM模型
长短期记忆网络(Long Short-Term Memory)是一种特殊类型的循环神经网络(RNN)。它专门设计用来解决传统RNN在处理长时间序列时的“梯度消失”问题。LSTM通过引入了称为“门控机制”的结构,能够有效地捕捉时间序列数据中的长期依赖关系,这使得LSTM在处理复杂的时间序列数据时表现尤为出色。
LSTM的核心结构由三个主要部分组成,输入门决定当前输入的哪些信息需要被记住,遗忘门决定哪些信息应该被忘记,即从记忆中移除,输出门决定当前时刻的记忆信息将如何影响下一时刻的输出。具体流程如图2:
Figure 2. LSTM neural network structure
图2. LSTM神经网络结构
股票市场是高度非线性和波动的,股票价格随时间变化的规律复杂且存在长时间的依赖性,使用LSTM进行股票价格预测有以下几个优势:一是捕捉时间依赖性。LSTM特别擅长捕捉时间序列数据中的长期依赖性,而股票价格的波动往往具有长期影响。二是处理复杂数据。股票市场受多种因素影响,包括公司财务、经济政策、市场情绪等,LSTM能够有效处理多种类型的数据并提取出有效特征。三是非线性建模。股价的变化不仅仅遵循简单的线性规律,LSTM能够处理复杂的非线性关系,这使得它在股票预测中的表现优于传统的时间序列预测方法。LSTM模型构建步骤如图3:
Figure 3. The training process of the LSTM neural network model
图3. LSTM神经网络模型训练流程
(三) ARIMA-LSTM模型
为构建兼具线性与非线性特征的时间序列预测表达式,本研究引入了Yt = At + Lt的模型架构,其中,Yt代表待预测的时间序列,At特指运用ARIMA模型剖析原始数据所获取的线性成分,其能够有效捕捉时间序列中的线性趋势与规律;而Lt则表征由LSTM模型解析得出的非线性部分,用于挖掘数据中的复杂、非线性动态变化。具体的ARIMA-LSTM模型的预测流程如下:
第一,借助ARIMA模型对原始数据进行拟合操作,进而得到初步预测值A1t;
第二,以真实值Y1t减去该预测值,由此生成残差序列,此残差序列蕴含着原始数据中未能被ARIMA模型线性捕捉的信息;最后,运用LSTM模型针对这一残差序列开展预测,得到L1t。
第三,通过组合二者,即Y1t = A1t + L1t,得到ARIMA-LSTM模型的综合预测值,以此实现对时间序列更为精准、全面的预测。
(四) 模型评价指标
为了更好地评估模型的有效性,文章选取平均绝对误差和均方根误差两个指标对模型进行评价,如下所示:
平均绝对误差是预测值与真实值之间绝对误差的平均值,MAE值越小,表示模型的预测误差越小,模型的表现越好。其计算公式为:
(2)
其中,
是真实值,
是预测值,n是样本数量。
均方根误差是预测值与真实值之间误差的平方的平均值的平方根,RMSE值越小,表示模型的预测精度越高,误差越小。它的计算公式为:
(3)
3. 实证分析
(一) 数据选取
本文选取黄金数据来源于RESSET锐思金融研究数据库,共得到4869条数据,为了构建和评估时间序列模型,数据按照8:2比例被划分为训练集和测试集,训练集包括从2004年1月1日到2020年12月31日的黄金价格数据,共4142条数据,而测试集则涵盖了2021年1月1日至2023年12月31日的价格数据,共727条数据。这是常见的数据划分比例,训练集占比较大,能够确保模型有足够的数据进行训练;测试集占比较小,但足以评估模型的预测效果。这样的划分能够确保模型在训练集上进行拟合,并在测试集上进行验证和预测效果的评估。
在数据预处理阶段,我们对原始数据进行了缺失值处理和异常值检测,确保数据的完整性和准确性。对于数据中存在的缺失值,采用了删除法进行处理。即直接删除含有缺失值的记录,以确保数据的完整性和连续性,这种方法适用于缺失值比例较小的情况,能够有效避免因插值或填充引入的偏差。采用统计方法对异常值进行检测,通过计算数据的均值和标准差,识别出偏离均值超过3倍标准差的数据点作为异常值。对于检测到的异常值,我们采用了修正法进行处理,将异常值修正为合理的数值,例如使用前后时间点的均值进行替换。这种方法能够保留数据的连续性,同时避免异常值对模型训练和预测的干扰。
通过预处理步骤,我们得到了一份包含中国平安股票开盘价的完整数据集,供后续模型训练和预测分析使用。这一数据集为本文后续的股票价格预测模型构建和优化提供了基础,并且为评估模型的预测准确性和效果提供了必要的实证支持。
(二) ARIMA模型分析
1) 平稳性检验
在建立模型之前,我们首先对黄金价格数据进行了平稳性检验,通过绘制时序图,我们观察到黄金价格的波动较大,表现出明显的非平稳性特征。因此,进一步进行了单位根检验,采用了ADF检验。初始检验结果显示,原始数据的P值为0.921121,大于常用显著性水平0.05,因此不能拒绝原假设,表明数据存在单位根,即为非平稳序列。随后,我们对数据进行了一级差分处理,经过差分后,ADF检验的P值降至0.000,小于0.05,拒绝了原假设,表明数据经过差分后已达到平稳状态。通过图4也可以清晰地看到,差分后的数据波动减小,趋势趋于平稳,验证了数据的平稳性。
Figure 4. Closing price and time series chart of the closing price after first-order differencing
图4. 收盘价及一阶差分后收盘价时序图
2) 自相关图、偏自相关图及模型定阶
Figure 5. Autocorrelation Function and Partial Autocorrelation Function
图5. ACF及PACF
在本研究中,我们通过ACF和PACF对时间序列的特征进行了初步分析,以确定合适的模型阶数。结果如图5所示,ACF图显示了不同滞后期下,序列与其自身过去值之间的相关性,通过ACF图,我们观察到随着滞后期的增加,自相关逐渐减弱,但在较高滞后期,如滞后5期,仍存在较强的自相关性。这表明,数据存在显著的滑动平均(MA)成分,因此选择了MA部分的阶数为5。PACF图则显示了序列与其滞后值之间的偏自相关性,通过分析PACF图,我们发现,在滞后3期时,偏自相关显著且急剧衰减,表明序列中存在显著的自回归(AR)成分。因此,选择了AR部分的阶数为3。
3) 优化模型
为了进一步验证模型阶数的选择,我们采用了信息准则,即AIC和BIC进行模型比较。在不同阶数的模型中,AR (3)和MA (5)模型分别对应较低的AIC和BIC值,说明该模型在拟合度和复杂度之间达到了较好的平衡。因此,我们选择了ARIMA(3,1,5)模型作为本研究的最终模型。结果如图6所示:
Figure 6. Akaike Information Criterion and Bayesian Information Criterion
图6. AIC及BIC
4) 模型检验
在模型定阶后,我们还进行了模型的检验。通过残差分析,发现残差呈现出随机性,且未表现出显著的自相关性,符合白噪声的特征。此外,Ljung-Box检验结果为0.518969,大于显著水平,无法拒绝原假设,说明残差序列没有显著得自相关,进一步确认了模型的有效性。总体而言,ARMA(3,1,5)模型能够有效捕捉数据中的时间序列特征,表现出了较好的拟合效果,并且满足了残差无自相关的假设,验证了其作为最佳模型的适用性。
5) 模型拟合
Figure 7. The fitting effect of the ARIMA model
图7. ARIMA模型拟合效果
在ARIMA(3,1,5)模型的拟合过程中,实际值与预测值的拟合效果良好,图7显示二者高度一致。通过Ljung-Box检验对残差进行检验,得到检验值为0.518969,大于显著性水平0.05,因此无法拒绝零假设,表明残差序列不存在显著的自相关,验证了模型的有效性和拟合质量。
6) 预测
图8呈现了ARIMA(3,1,5)模型对黄金价格的预测结果与实际值对比。其中,蓝色线为实际价格,橙色线是模型预测值ARIMA(3,1,5),阴影部分为95%置信区间。图9展示了训练集、测试集及预测结果,可以看到ARIMA模型只能预测线性部分,所以是一条直线。从两图中可见,模型在一定程度上捕捉到了价格走势,但仍存在偏差,只能预测线性部分的价格,而非线性部分是无法预测的,这体现了模型在黄金价格预测中的表现及局限性,为后续改进提供了直观参考。
Figure 8. Predicted results and actual results
图8. 预测结果与实际结果
Figure 9. Training set, test set and prediction results
图9. 训练集、测试集及预测结果
(三) LSTM模型分析
在金融研究领域,金融时间序列数据备受研究者关注,精准预测金融资产收益率与价格走向,对投资、风控意义重大。当下,考虑数据线性与非线性特征已成共识,传统的ARIMA模型虽为时间序列分析经典工具,能凭借自回归、差分、移动平均组件捕捉线性规律,然而面对现实金融市场复杂交织的非线性特性时,却难以精准建模。
深度学习中的长短期记忆网络专为序列数据打造,其独特的门控机制可灵活捕捉长短期依赖关系,处理非线性关系预测能力出众。鉴于黄金作为关键避险资产,价格受利率等线性因素影响,还会因地缘政治、突发公共事件、投资者情绪等非线性因素剧烈波动,本次研究选用LSTM模型预测黄金价格,期望挖掘规律、辅助决策。此前ARIMA模型残差诊断分析代码,虽暴露其短板,但残差剖析方法也为运用LSTM模型提供了对比思路。
图10展示了LSTM模型的预测结果,蓝色线条为实际值,黄色线条为预测值。由LSTM模型对黄金价格预测的结果可知,短期内模型预测走向与实际大致相同,证明其能捕捉近期价格动态趋势,一定程度反映当下市场规律。但长期来看存在偏差,这凸显黄金市场受长期宏观因素影响复杂多变,模型虽有局限,不过仍可为短期决策提供参考,助力市场参与者把握先机。
Figure 10. The actual results and predicted values of the Long Short-Term Memory (LSTM)
图10. LSTM实际结果与预测值
(四) ARIMA-LSTM模型分析
ARIMA模型与LSTM模型分别在组合模型中发挥着极大作用。ARIMA模型捕捉时间序列中的线性特征,提供初步预测,简化LSTM的学习任务;LSTM模型捕捉时间序列中的非线性特征,学习ARIMA无法解释的残差信息,处理长期依赖关系。ARIMA和LSTM通过结合线性和非线性建模能力,能够更全面地描述时间序列的动态变化,从而提高预测精度和模型的鲁棒性。通过这种组合方式,ARIMA-LSTM模型能够充分利用两种方法的优势,克服单一模型的局限性,适用于复杂时间序列的预测任务。
在这里加入了GRU模型进行对比,GRU是一种改进的循环神经网络(RNN)架构,旨在解决传统RNN在处理长序列时面临的梯度消失和梯度爆炸问题。GRU通过引入“更新门”和“重置门”来控制信息的流动和记忆的更新,从而提高了训练效率和模型性能。与LSTM相比,GRU结构更为简洁,参数更少,因此在某些任务中能够以较少的计算成本实现类似的效果,GRU在自然语言处理、语音识别和时间序列预测等任务中得到了广泛应用。
如图11所示,在黄金价格预测方面,ARIMA-LSTM模型与GRU模型的预测效果差异并不显著,不过ARIMA-LSTM模型在某些方面展现出了相对更优的预测能力,其预测曲线与实际价格走势的契合度略高。总体而言,这两个模型均能够较好地捕捉黄金价格的波动趋势,对黄金价格做出较为准确的预测,从而为投资者在决策过程中提供具有一定参考价值的信息,助力投资者更合理地规划投资策略,降低投资风险,提升投资收益的可能性。
Figure 11. Comparison among the combined model, the GRU (Gated Recurrent Unit) model and the true values
图11. 组合模型、GRU模型及真实值对比
(五) 模型评估
在评估模型对黄金价格的预测性能时,我们选用MAE与RMSE作为关键指标,其值越小则模型预测结果越接近真实值,表现越佳。结果如表1所示,从实际计算结果可知,传统的ARIMA(3,1,5)模型在面对黄金价格数据时存在一定局限,其MAE和RMSE值相对较高,单独的机器学习LSTM的两个评价指标更高,这意味着预测值与真实值偏差明显。而ARIMA_LSTM和GRU这两种深度学习模型优势显著,它们的MAE与RMSE值均低于ARIMA(3,1,5)模型和LSTM模型,表明其能更精准地捕捉黄金价格的波动趋势,预测结果更可靠,能为投资者制定决策提供更有力的支持。但由于金融市场复杂多变,受多种因素交织影响,即使这两个模型目前表现较好,仍需进一步优化改进,以提升其对市场环境的适应性和预测能力。
Table 1. Comparison of model evaluation indicators
表1. 模型评价指标对比
模型 |
MAE |
RMSE |
ARIMA(3,1,5) |
31.2457 |
48.3117 |
LSTM |
58.6194 |
75.3816 |
ARIMA-LSTM |
29.0028 |
39.1074 |
GRU |
29.0727 |
39.1452 |
4. 结论
本研究聚焦于黄金价格的精准预测,通过构建并实证分析非线性ARIMA-LSTM组合模型,取得了具有一定价值的研究成果,同时也为金融预测领域提供了新的思路和方法。
在理论层面,梳理了ARIMA、LSTM以及二者组合模型的相关理论。传统的ARIMA模型虽应用广泛,具备灵活性和可解释性等优势,但受数据平稳性限制且易丢失信息;LSTM模型作为深度学习模型,在处理非线性关系方面优势明显,能够有效捕捉时间序列数据中的长期依赖关系。而ARIMA-LSTM组合模型巧妙地融合了二者的长处,理论上具备更强大的预测能力。
实证分析阶段,选取了来自RESSET锐思金融研究数据库的4869条黄金数据,并按8:2的比例划分训练集和测试集。对数据进行了一系列处理和分析,其中ARIMA(3,1,5)模型经过平稳性检验、模型定阶、优化、检验及拟合等步骤后,虽能捕捉数据中的时间序列特征,但在预测黄金价格时仍存在偏差,其MAE和RMSE值相对较高,说明预测精度有待提升。LSTM模型在短期内对黄金的价格预测相对来说较为准确,而长远来看不利于参考,单一的模型同样也存在局限,于是引出组合模型来与单一模型对比。
引入GRU模型进行对比后发现,ARIMA-LSTM模型在黄金价格预测方面展现出优于传统ARIMA模型及单一机器学习模型的能力。组合模型的MAE与RMSE值均低于ARIMA(3,1,5)模型、LSTM模型及GRU模型,预测曲线与实际价格走势的契合度更高,能够较好地捕捉黄金价格的波动趋势,为投资者提供了更具参考价值的信息。
尽管ARIMA-LSTM模型在本研究中取得了较好的预测效果,但金融市场环境复杂多变,受到宏观经济政策调整、地缘政治事件、市场情绪波动等多种因素的综合影响,即使是表现相对出色的模型也可能面临挑战。未来在金融时间序列预测领域,仍有很大的研究空间和发展潜力,通过不断改进和完善预测模型,有望为经济政策制定者和投资者提供更为准确可靠的决策依据,更好地应对金融市场的不确定性。