基于ARIMA-LSTM模型的黄金价格趋势深度预测
Gold Price Trend Depth Prediction Based on ARIMA-LSTM Model
DOI: 10.12677/ecl.2025.143831, PDF, HTML, XML,   
作者: 夏 芬:贵州大学经济学院,贵州 贵阳
关键词: 预测ARIMA模型LSTM模型ARIMA-LSTM模型Forecast ARIMA Model LSTM Model ARIMA-LSTM Model
摘要: 金融时间序列预测对经济决策和投资意义重大,但金融市场的复杂性给预测模型构建带来挑战,而黄金价格走势备受关注,准确预测至关重要。本文针对现有组合模型不足,提出创新的非线性ARIMA-LSTM组合模型用于黄金价格预测。实证分析发现,ARIMA(3,1,5)模型、LSTM模型及GRU模型虽能捕捉时间序列特征但预测存在偏差,结果表明组合模型ARIMA-LSTM预测效果优于其他三种模型。通过MAE和RMSE评估,验证了ARIMA-LSTM模型在黄金价格预测中的优势,为金融决策提供新思路。
Abstract: Financial time series forecasting is of great significance to economic decision-making and investment, but the complexity of financial markets brings challenges to the construction of forecasting models, and the trend of gold price has attracted much attention, so accurate forecasting is crucial. This paper aims at the shortcomings of existing combination models, an innovative nonlinear ARIMA-LSTM combined model is proposed for gold price prediction. The empirical analysis shows that although ARIMA(3,1,5) model, LSTM model and GRU model can capture the features of time series, the prediction bias exists. The results show that the combined model ARIMA-LSTM has better prediction effect than the other three models. Through MAE and RMSE evaluation, the advantages of ARIMA-LSTM model in gold price prediction are verified, which provides new ideas for financial decision-making.
文章引用:夏芬. 基于ARIMA-LSTM模型的黄金价格趋势深度预测[J]. 电子商务评论, 2025, 14(3): 1331-1341. https://doi.org/10.12677/ecl.2025.143831

1. 引言

金融时间序列预测在金融领域至关重要,其准确性对于经济政策制定者和投资者意义非凡,既能助力经济决策,又能帮助投资者把握机遇、防范风险[1]。但金融市场的复杂多变,使得时间序列数据夹杂着随机噪声与非线性关系,给预测模型构建带来难题。在当今复杂多变的金融市场环境下,黄金作为一种重要的避险资产,其价格走势备受投资者与经济决策者关注,准确预测黄金价格不仅能为投资策略制定提供关键指引,还对宏观经济稳定研判意义非凡。

金融时间序列预测的研究方法从统计模型发展到智能模型,并逐步从单一模型扩展到组合模型。典型统计模型如ARIMA和GARCH应用广泛。例如,ARIMA与多层感知器(MLPs)结合,用于预测标准普尔500指数、深证成分股指数和道琼斯指数,展现了组合模型的潜力[2]。对比改进的GARCH族模型在股票市场预测中的准确性等性能[3]。随着计算技术的飞速进步,以人工神经网络(ANN)为核心的智能化方法逐渐崭露头角。这类方法在处理不完整、模糊或无明显规律的数据时表现优异,尤其在捕捉非线性关系方面具有显著优势。此外,以反向传播神经网络(BPNN)为基础的浅层网络结构[4],以及支持向量机(SVM)等经典机器学习算法[5],也在金融市场预测中得到了广泛采用。

早期,何树红等(2014)指出ARIMA、ARMA、GARCH等传统时间序列方法常用于股票价格预测,通过分析历史数据特征来捕捉价格走势规律[6]。ARIMA模型通过对历史数据建模,拟合时间序列数据的变动规律,进而预测未来股票的变化[7]。之后,随着技术与理论的推进,机器学习和深度学习方法兴起[8],李丽萍等(2023)以云南旅游股票数据构建LSTM神经网络模型,相比BP和Elman神经网络模型,其预测误差更小、结果更准、拟合度更高,能更好捕捉股价动态变化[9]。姜淑瑜(2024)根据股票市场的特点和LSTM递归神经网络的特性,对股价进行预测,实验结果表明,LSTM模型预测股价,结果误差小,精准度高,具有良好的预测效果[10]

传统的ARIMA等统计模型虽应用广泛,却受数据平稳性限制且易丢失信息,而LSTM等深度学习模型随人工智能发展,在处理非线性关系上展现优势,徐卫泽(2020)比较了ARIMA模型和LSTM模型,并得出结论LSTM模型的准确性优于ARIMA模型[11]。不过单一模型难以全面应对金融数据的复杂特性,促使组合模型成为研究热点。次必聪等(2022)则选取多种金融指数构建非线性ARIMA-LSTM组合模型,在不同预测区间对金融时间序列进行分析,提供了新途径[12]

综上,现有股票价格预测方法各有利弊,ARIMA-LSTM模型融合了传统与深度学习优势,在金融时间序列价格预测中颇具潜力,为本研究基于该模型预测时间序列价格奠定了理论与实践基础,本文也正是在此背景下,针对当前组合模型的不足,提出创新的非线性ARIMA-LSTM组合模型,充分发挥二者优势,实现对黄金价格走势的高精度预测,并通过与单一及传统线性组合模型对比实证分析其预测性能,为金融决策开拓新思路,推动金融预测领域发展。

2. 相关理论和模型介绍

() ARIMA模型

ARIMA模型是一种强大的时间序列分析工具,适用于无明显季节性波动的时间序列预测,通过对时间序列进行自回归(p)、差分(d)和滑动平均处理(q),ARIMA模型能够有效捕捉数据中的趋势和随机波动,从而提供可靠的预测结果,在实际应用中,ARIMA的优势在于其灵活性和可解释性,使其成为时间序列建模的经典方法之一。ARIMA模型如下:

{             ϕ ( B ) = d x t = θ ( B ) ε t E ( ε t ) = 0 V a r ( ε t ) = δ ε 2 E ( ε t ε s ) = 0 s t E x s ε t = 0 s < t (1)

其中 ε t 为当期随机干扰;B为延迟算子; d = ( 1 B ) d xt为过去的序列值。 ϕ ( B ) = 1 ϕ 1 B ϕ p B p p阶自回归系数多项式; θ ( B ) = 1 θ 1 B θ q B q q阶移动平滑系数多项式。

ARIMA模型的构建通常涉及几个步骤,一是检查数据的平稳性,必要时进行差分操作;二是通过自相关函数和偏自相关函数图来确定模型的阶数pdq;三是使用最大似然估计或最小二乘法等方法来估计模型的参数;四是检验残差是否符合白噪声的假设,以验证模型的有效性。具体流程如图1

Figure 1. The ARIMA modeling process

1. ARIMA建模流程

() LSTM模型

长短期记忆网络(Long Short-Term Memory)是一种特殊类型的循环神经网络(RNN)。它专门设计用来解决传统RNN在处理长时间序列时的“梯度消失”问题。LSTM通过引入了称为“门控机制”的结构,能够有效地捕捉时间序列数据中的长期依赖关系,这使得LSTM在处理复杂的时间序列数据时表现尤为出色。

LSTM的核心结构由三个主要部分组成,输入门决定当前输入的哪些信息需要被记住,遗忘门决定哪些信息应该被忘记,即从记忆中移除,输出门决定当前时刻的记忆信息将如何影响下一时刻的输出。具体流程如图2

Figure 2. LSTM neural network structure

2. LSTM神经网络结构

股票市场是高度非线性和波动的,股票价格随时间变化的规律复杂且存在长时间的依赖性,使用LSTM进行股票价格预测有以下几个优势:一是捕捉时间依赖性。LSTM特别擅长捕捉时间序列数据中的长期依赖性,而股票价格的波动往往具有长期影响。二是处理复杂数据。股票市场受多种因素影响,包括公司财务、经济政策、市场情绪等,LSTM能够有效处理多种类型的数据并提取出有效特征。三是非线性建模。股价的变化不仅仅遵循简单的线性规律,LSTM能够处理复杂的非线性关系,这使得它在股票预测中的表现优于传统的时间序列预测方法。LSTM模型构建步骤如图3

Figure 3. The training process of the LSTM neural network model

3. LSTM神经网络模型训练流程

() ARIMA-LSTM模型

为构建兼具线性与非线性特征的时间序列预测表达式,本研究引入了Yt = At + Lt的模型架构,其中,Yt代表待预测的时间序列,At特指运用ARIMA模型剖析原始数据所获取的线性成分,其能够有效捕捉时间序列中的线性趋势与规律;而Lt则表征由LSTM模型解析得出的非线性部分,用于挖掘数据中的复杂、非线性动态变化。具体的ARIMA-LSTM模型的预测流程如下:

第一,借助ARIMA模型对原始数据进行拟合操作,进而得到初步预测值A1t;

第二,以真实值Y1t减去该预测值,由此生成残差序列,此残差序列蕴含着原始数据中未能被ARIMA模型线性捕捉的信息;最后,运用LSTM模型针对这一残差序列开展预测,得到L1t。

第三,通过组合二者,即Y1t = A1t + L1t,得到ARIMA-LSTM模型的综合预测值,以此实现对时间序列更为精准、全面的预测。

() 模型评价指标

为了更好地评估模型的有效性,文章选取平均绝对误差和均方根误差两个指标对模型进行评价,如下所示:

平均绝对误差是预测值与真实值之间绝对误差的平均值,MAE值越小,表示模型的预测误差越小,模型的表现越好。其计算公式为:

MAE = 1 n i = 1 n | y i y ' i | (2)

其中, y i 是真实值, y ' i 是预测值,n是样本数量。

均方根误差是预测值与真实值之间误差的平方的平均值的平方根,RMSE值越小,表示模型的预测精度越高,误差越小。它的计算公式为:

RMSE = 1 n i = 1 n ( y i y ' i ) 2 (3)

3. 实证分析

() 数据选取

本文选取黄金数据来源于RESSET锐思金融研究数据库,共得到4869条数据,为了构建和评估时间序列模型,数据按照8:2比例被划分为训练集和测试集,训练集包括从2004年1月1日到2020年12月31日的黄金价格数据,共4142条数据,而测试集则涵盖了2021年1月1日至2023年12月31日的价格数据,共727条数据。这是常见的数据划分比例,训练集占比较大,能够确保模型有足够的数据进行训练;测试集占比较小,但足以评估模型的预测效果。这样的划分能够确保模型在训练集上进行拟合,并在测试集上进行验证和预测效果的评估。

在数据预处理阶段,我们对原始数据进行了缺失值处理和异常值检测,确保数据的完整性和准确性。对于数据中存在的缺失值,采用了删除法进行处理。即直接删除含有缺失值的记录,以确保数据的完整性和连续性,这种方法适用于缺失值比例较小的情况,能够有效避免因插值或填充引入的偏差。采用统计方法对异常值进行检测,通过计算数据的均值和标准差,识别出偏离均值超过3倍标准差的数据点作为异常值。对于检测到的异常值,我们采用了修正法进行处理,将异常值修正为合理的数值,例如使用前后时间点的均值进行替换。这种方法能够保留数据的连续性,同时避免异常值对模型训练和预测的干扰。

通过预处理步骤,我们得到了一份包含中国平安股票开盘价的完整数据集,供后续模型训练和预测分析使用。这一数据集为本文后续的股票价格预测模型构建和优化提供了基础,并且为评估模型的预测准确性和效果提供了必要的实证支持。

() ARIMA模型分析

1) 平稳性检验

在建立模型之前,我们首先对黄金价格数据进行了平稳性检验,通过绘制时序图,我们观察到黄金价格的波动较大,表现出明显的非平稳性特征。因此,进一步进行了单位根检验,采用了ADF检验。初始检验结果显示,原始数据的P值为0.921121,大于常用显著性水平0.05,因此不能拒绝原假设,表明数据存在单位根,即为非平稳序列。随后,我们对数据进行了一级差分处理,经过差分后,ADF检验的P值降至0.000,小于0.05,拒绝了原假设,表明数据经过差分后已达到平稳状态。通过图4也可以清晰地看到,差分后的数据波动减小,趋势趋于平稳,验证了数据的平稳性。

Figure 4. Closing price and time series chart of the closing price after first-order differencing

4. 收盘价及一阶差分后收盘价时序图

2) 自相关图、偏自相关图及模型定阶

Figure 5. Autocorrelation Function and Partial Autocorrelation Function

5. ACF及PACF

在本研究中,我们通过ACF和PACF对时间序列的特征进行了初步分析,以确定合适的模型阶数。结果如图5所示,ACF图显示了不同滞后期下,序列与其自身过去值之间的相关性,通过ACF图,我们观察到随着滞后期的增加,自相关逐渐减弱,但在较高滞后期,如滞后5期,仍存在较强的自相关性。这表明,数据存在显著的滑动平均(MA)成分,因此选择了MA部分的阶数为5。PACF图则显示了序列与其滞后值之间的偏自相关性,通过分析PACF图,我们发现,在滞后3期时,偏自相关显著且急剧衰减,表明序列中存在显著的自回归(AR)成分。因此,选择了AR部分的阶数为3。

3) 优化模型

为了进一步验证模型阶数的选择,我们采用了信息准则,即AIC和BIC进行模型比较。在不同阶数的模型中,AR (3)和MA (5)模型分别对应较低的AIC和BIC值,说明该模型在拟合度和复杂度之间达到了较好的平衡。因此,我们选择了ARIMA(3,1,5)模型作为本研究的最终模型。结果如图6所示:

Figure 6. Akaike Information Criterion and Bayesian Information Criterion

6. AIC及BIC

4) 模型检验

在模型定阶后,我们还进行了模型的检验。通过残差分析,发现残差呈现出随机性,且未表现出显著的自相关性,符合白噪声的特征。此外,Ljung-Box检验结果为0.518969,大于显著水平,无法拒绝原假设,说明残差序列没有显著得自相关,进一步确认了模型的有效性。总体而言,ARMA(3,1,5)模型能够有效捕捉数据中的时间序列特征,表现出了较好的拟合效果,并且满足了残差无自相关的假设,验证了其作为最佳模型的适用性。

5) 模型拟合

Figure 7. The fitting effect of the ARIMA model

7. ARIMA模型拟合效果

在ARIMA(3,1,5)模型的拟合过程中,实际值与预测值的拟合效果良好,图7显示二者高度一致。通过Ljung-Box检验对残差进行检验,得到检验值为0.518969,大于显著性水平0.05,因此无法拒绝零假设,表明残差序列不存在显著的自相关,验证了模型的有效性和拟合质量。

6) 预测

图8呈现了ARIMA(3,1,5)模型对黄金价格的预测结果与实际值对比。其中,蓝色线为实际价格,橙色线是模型预测值ARIMA(3,1,5),阴影部分为95%置信区间。图9展示了训练集、测试集及预测结果,可以看到ARIMA模型只能预测线性部分,所以是一条直线。从两图中可见,模型在一定程度上捕捉到了价格走势,但仍存在偏差,只能预测线性部分的价格,而非线性部分是无法预测的,这体现了模型在黄金价格预测中的表现及局限性,为后续改进提供了直观参考。

Figure 8. Predicted results and actual results

8. 预测结果与实际结果

Figure 9. Training set, test set and prediction results

9. 训练集、测试集及预测结果

() LSTM模型分析

在金融研究领域,金融时间序列数据备受研究者关注,精准预测金融资产收益率与价格走向,对投资、风控意义重大。当下,考虑数据线性与非线性特征已成共识,传统的ARIMA模型虽为时间序列分析经典工具,能凭借自回归、差分、移动平均组件捕捉线性规律,然而面对现实金融市场复杂交织的非线性特性时,却难以精准建模。

深度学习中的长短期记忆网络专为序列数据打造,其独特的门控机制可灵活捕捉长短期依赖关系,处理非线性关系预测能力出众。鉴于黄金作为关键避险资产,价格受利率等线性因素影响,还会因地缘政治、突发公共事件、投资者情绪等非线性因素剧烈波动,本次研究选用LSTM模型预测黄金价格,期望挖掘规律、辅助决策。此前ARIMA模型残差诊断分析代码,虽暴露其短板,但残差剖析方法也为运用LSTM模型提供了对比思路。

图10展示了LSTM模型的预测结果,蓝色线条为实际值,黄色线条为预测值。由LSTM模型对黄金价格预测的结果可知,短期内模型预测走向与实际大致相同,证明其能捕捉近期价格动态趋势,一定程度反映当下市场规律。但长期来看存在偏差,这凸显黄金市场受长期宏观因素影响复杂多变,模型虽有局限,不过仍可为短期决策提供参考,助力市场参与者把握先机。

Figure 10. The actual results and predicted values of the Long Short-Term Memory (LSTM)

10. LSTM实际结果与预测值

() ARIMA-LSTM模型分析

ARIMA模型与LSTM模型分别在组合模型中发挥着极大作用。ARIMA模型捕捉时间序列中的线性特征,提供初步预测,简化LSTM的学习任务;LSTM模型捕捉时间序列中的非线性特征,学习ARIMA无法解释的残差信息,处理长期依赖关系。ARIMA和LSTM通过结合线性和非线性建模能力,能够更全面地描述时间序列的动态变化,从而提高预测精度和模型的鲁棒性。通过这种组合方式,ARIMA-LSTM模型能够充分利用两种方法的优势,克服单一模型的局限性,适用于复杂时间序列的预测任务。

在这里加入了GRU模型进行对比,GRU是一种改进的循环神经网络(RNN)架构,旨在解决传统RNN在处理长序列时面临的梯度消失和梯度爆炸问题。GRU通过引入“更新门”和“重置门”来控制信息的流动和记忆的更新,从而提高了训练效率和模型性能。与LSTM相比,GRU结构更为简洁,参数更少,因此在某些任务中能够以较少的计算成本实现类似的效果,GRU在自然语言处理、语音识别和时间序列预测等任务中得到了广泛应用。

图11所示,在黄金价格预测方面,ARIMA-LSTM模型与GRU模型的预测效果差异并不显著,不过ARIMA-LSTM模型在某些方面展现出了相对更优的预测能力,其预测曲线与实际价格走势的契合度略高。总体而言,这两个模型均能够较好地捕捉黄金价格的波动趋势,对黄金价格做出较为准确的预测,从而为投资者在决策过程中提供具有一定参考价值的信息,助力投资者更合理地规划投资策略,降低投资风险,提升投资收益的可能性。

Figure 11. Comparison among the combined model, the GRU (Gated Recurrent Unit) model and the true values

11. 组合模型、GRU模型及真实值对比

() 模型评估

在评估模型对黄金价格的预测性能时,我们选用MAE与RMSE作为关键指标,其值越小则模型预测结果越接近真实值,表现越佳。结果如表1所示,从实际计算结果可知,传统的ARIMA(3,1,5)模型在面对黄金价格数据时存在一定局限,其MAE和RMSE值相对较高,单独的机器学习LSTM的两个评价指标更高,这意味着预测值与真实值偏差明显。而ARIMA_LSTM和GRU这两种深度学习模型优势显著,它们的MAE与RMSE值均低于ARIMA(3,1,5)模型和LSTM模型,表明其能更精准地捕捉黄金价格的波动趋势,预测结果更可靠,能为投资者制定决策提供更有力的支持。但由于金融市场复杂多变,受多种因素交织影响,即使这两个模型目前表现较好,仍需进一步优化改进,以提升其对市场环境的适应性和预测能力。

Table 1. Comparison of model evaluation indicators

1. 模型评价指标对比

模型

MAE

RMSE

ARIMA(3,1,5)

31.2457

48.3117

LSTM

58.6194

75.3816

ARIMA-LSTM

29.0028

39.1074

GRU

29.0727

39.1452

4. 结论

本研究聚焦于黄金价格的精准预测,通过构建并实证分析非线性ARIMA-LSTM组合模型,取得了具有一定价值的研究成果,同时也为金融预测领域提供了新的思路和方法。

在理论层面,梳理了ARIMA、LSTM以及二者组合模型的相关理论。传统的ARIMA模型虽应用广泛,具备灵活性和可解释性等优势,但受数据平稳性限制且易丢失信息;LSTM模型作为深度学习模型,在处理非线性关系方面优势明显,能够有效捕捉时间序列数据中的长期依赖关系。而ARIMA-LSTM组合模型巧妙地融合了二者的长处,理论上具备更强大的预测能力。

实证分析阶段,选取了来自RESSET锐思金融研究数据库的4869条黄金数据,并按8:2的比例划分训练集和测试集。对数据进行了一系列处理和分析,其中ARIMA(3,1,5)模型经过平稳性检验、模型定阶、优化、检验及拟合等步骤后,虽能捕捉数据中的时间序列特征,但在预测黄金价格时仍存在偏差,其MAE和RMSE值相对较高,说明预测精度有待提升。LSTM模型在短期内对黄金的价格预测相对来说较为准确,而长远来看不利于参考,单一的模型同样也存在局限,于是引出组合模型来与单一模型对比。

引入GRU模型进行对比后发现,ARIMA-LSTM模型在黄金价格预测方面展现出优于传统ARIMA模型及单一机器学习模型的能力。组合模型的MAE与RMSE值均低于ARIMA(3,1,5)模型、LSTM模型及GRU模型,预测曲线与实际价格走势的契合度更高,能够较好地捕捉黄金价格的波动趋势,为投资者提供了更具参考价值的信息。

尽管ARIMA-LSTM模型在本研究中取得了较好的预测效果,但金融市场环境复杂多变,受到宏观经济政策调整、地缘政治事件、市场情绪波动等多种因素的综合影响,即使是表现相对出色的模型也可能面临挑战。未来在金融时间序列预测领域,仍有很大的研究空间和发展潜力,通过不断改进和完善预测模型,有望为经济政策制定者和投资者提供更为准确可靠的决策依据,更好地应对金融市场的不确定性。

参考文献

[1] Yu, H., Ming, L.J., Sumei, R. and Shuping, Z. (2020) A Hybrid Model for Financial Time Series Forecasting—Integration of EWT, ARIMA with the Improved ABC Optimized Elm. IEEE Access, 8, 84501-84518.
https://doi.org/10.1109/access.2020.2987547
[2] Rahimi, Z.H. and Khashei, M. (2018) A Least Squares-Based Parallel Hybridization of Statistical and Intelligent Models for Time Series Forecasting. Computers & Industrial Engineering, 118, 44-53.
https://doi.org/10.1016/j.cie.2018.02.023
[3] Kim, H.Y. and Won, C.H. (2018) Forecasting the Volatility of Stock Price Index: A Hybrid Model Integrating LSTM with Multiple Garch-Type Models. Expert Systems with Applications, 103, 25-37.
https://doi.org/10.1016/j.eswa.2018.03.002
[4] 张品一, 罗春燕, 梁锶. 基于GA-BP神经网络模型的黄金价格仿真预测[J]. 统计与决策, 2018, 34(17): 158-161.
[5] 彭丽芳, 孟志青, 姜华, 等. 基于时间序列的支持向量机在股票预测中的应用[J]. 计算机技术与自动化, 2006, 25(3): 88-91.
[6] 何树红, 吴迪, 张月秋. 比较BP神经网络和RBF神经网络在基金净值预测中的应用[J]. 云南民族大学学报(自然科学版), 2014, 23(2): 124-127, 145.
[7] 黄梦婷. 基于ARIMA模型的股票价格预测实证研究[J]. 内江科技, 2023, 44(3): 61-62.
[8] 崔文喆, 李宝毅, 于德胜. 基于GARCH模型和BP神经网络模型的股票价格预测实证分析[J]. 天津师范大学学报(自然科学版), 2019, 39(5): 30-34.
[9] 李丽萍, 曾丽芳, 江绍萍, 等. 基于LSTM神经网络的股票价格预测[J]. 云南民族大学学报(自然科学版), 2023, 32(4): 528-532.
[10] 姜淑瑜. 基于LSTM模型的股票价格预测[J]. 江苏商论, 2025(1): 83-86.
[11] 次必聪, 张品一. 基于ARIMA-LSTM模型的金融时间序列预测[J]. 统计与决策, 2022, 38(11): 145-149.
[12] Sun, Y., Zhao, Z., Ma, X. and Du, Z. (2019) Short-Timescale Gravitational Microlensing Events Prediction with ARIMA-LSTM and ARIMA-GRU Hybrid Model. In: Li, J., Meng, X., Zhang, Y., Cui, W. and Du, Z., Eds., Big Scientific Data Management, Springer, 224-238.
https://doi.org/10.1007/978-3-030-28061-1_23

Baidu
map