Stock Price Prediction Based on the ARIMA Model
In this paper, the closing price of Ping’an Bank stock is studied based on ARIMA model to predict the closing price. The ARIMA (2,1,1) model was constructed by selecting the closing prices from January 2, 2024 to November 30, 2024 as the training set and the closing prices from December 1, 2024 to January 2, 2025 as the test set. The model predicted the closing price of stocks in the coming month after smoothness test, parameter fixed order and diagnostic test, and compared with the actual data. The results show that the ARIMA model has high accuracy in short-term stock price prediction with small prediction error, and can provide valuable reference for investors.
ARIMA Model
股票市场作为现代金融体系的重要组成部分,其价格波动不仅反映了企业的经营状况和市场供需关系,还受到宏观经济环境、政策变化、市场情绪等多种因素的影响。股票价格的预测一直是金融领域的重要研究课题,吸引了学术界和业界的广泛关注。准确预测股票价格不仅有助于投资者制定合理的投资策略,降低投资风险,还能为市场监管者提供决策支持,维护金融市场的稳定。
随着金融市场的全球化和信息化,股票价格的波动性日益增强,传统的预测方法逐渐显示出局限性,早期的股票价格预测主要依赖于技术分析和基本面分析。技术分析通过研究历史价格和交易量数据,寻找价格波动的规律;基本面分析则通过分析企业的财务报表、行业前景和宏观经济指标,评估股票的内在价值。然而,这些方法往往依赖于分析者的主观判断,难以应对市场的复杂性和不确定性。为了克服传统方法的局限性,研究者们开始引入数学模型和统计方法进行股票价格预测。其中,时间序列分析是最常用的方法之一。ARIMA模型作为时间序列分析的代表性模型,能够捕捉时间序列中的趋势、季节性和随机波动,广泛应用于股票价格预测。ARIMA模型通过对历史数据的拟合,预测未来的价格走势,尤其适用于短期预测。
本文以平安银行股票为例,探讨ARIMA模型在股票价格预测中的应用。通过构建ARIMA模型,预测未来一个月的股票收盘价,并评估模型的预测效果,旨在为投资者提供一种有效的预测工具。本文的研究不仅有助于验证ARIMA模型在股票价格预测中的有效性,还为未来的研究提供了新的思路和方法。
股票市场是现代金融体系的核心枢纽,其价格波动蕴含海量信息。这一波动不仅直观反映企业的经营实况与市场供需格局,还与宏观经济环境的起伏、政策导向的调整以及市场情绪的变化紧密相连,受这些多元因素交织影响。股票市场的价格波动被视为经济发展的晴雨表,对股票价格的精准预测一直是众多研究学者努力的方向,如何对股价进行精准预测变得越来越重要。
姜淑瑜根据股票市场的特点和LSTM递归神经网络的特性,对浦发银行(600000)股价进行预测。实验结果表明,LSTM模型预测股价,结果误差小,精准度高,具有良好的预测效果
总体来看,股票研究正朝着数据驱动、技术融合和全球化视角的方向发展。无论是国内还是国外,大数据、人工智能和机器学习技术的应用都在不断深化,为股票研究提供了新的工具和方法。同时,随着全球对可持续发展的重视,ESG投资成为国内外研究的共同重点。未来,股票研究将更加注重跨学科融合,结合传统方法与现代技术,以应对日益复杂的市场环境,为投资者提供更精准的决策支持。
ARIMA模型是一种经典的时间序列预测模型,广泛应用于经济学、金融学、气象学、销售预测等领域。ARIMA模型通过对时间序列数据的自回归(AR)、差分(I)和滑动平均(MA)进行建模,能够有效捕捉时间序列中的趋势、季节性和随机波动,从而对未来值进行预测。它用 的形式来表示,其中p代表自回归项的阶数,d代表差分次数,而q代表移动平均项的阶数。
(1) 自回归(AR):自回归部分表示当前值与过去若干期值之间的线性关系,模型假设当前值可以表示为过去p个值的加权和。自回归模型表示如下:
(1)
其中, 是当前值, 是自回归系数, 是误差项。
(2) 差分(I):差分的主要目的是确保时间序列数据的稳定性。当时间序列中的数据表现出趋势性和季节性时,通过对时间序列数据进行一阶或多阶差分处理,可以消除它的趋势性和季节性的影响,让时间序列数据趋于平稳。公式表示如下:
(2)
(3) 滑动平均(MA):这部分是用来捕捉时间序列数据的随机误差,在ARIMA模型中,通过将误差项的当前观测值与过去的观测值来实现的,可以帮助模型调整因自回归部分未能捕捉到的随机波动。模型假定误差项是独立同分布,并且误差项没有自相关性,公式表示如下:
(3)
其中, 是滑动平均系数, 是误差项。
ARIMA模型通过对上述三种项的组合得到,即:
(4)
本文使用ARIMA模型对平安银行股票的收盘价进行预测。选取2024年1月2日至2024年11月30日的收盘价作为模型的训练集,2024年12月1日至2025年1月2日的收盘价作为测试集。用训练出来的ARIMA模型预测2024年12月1日至2025年1月2日的收盘价,并与真实数据做比较。最后,用评价指标MAE、RMSE和MAPE衡量模型的预测准确性。
对训练集数据做单位根(ADF)检验,ADF检验如
Augmented Dickey-Fuller Test |
|
Test Statistic |
−2.2619 |
P-value |
0.1846 |
由
Augmented Dickey-Fuller Test |
|
Test Statistic |
−10.7518e−10 |
P-value |
2.6533e−19 |
由
对一阶差分后的数据画出其自相关图(ACF)和偏自相关图(PACF),如
对一阶差分后的数据运用参数网格搜索,尝试不同的ARIMA模型参数 的组合,以找到最小化赤池信息准则(AIC)的组合。AIC是衡量模型拟合优度的一种准则,AIC值越小,表明模型效果越好。
如
接着,利用极大似然估计对模型参数进行估计,ARIMA (2,1,1)模型系数的估计值、置信区间以及检验的P值如
coef |
P-value |
95%置信下限 |
95%置信上限 |
|
AR. L1 |
0.0490 |
0.0036 |
−0.0266 |
0.1246 |
AR. L2 |
0.1501 |
0.0024 |
0.0533 |
0.2469 |
ma. L1 |
0.0187 |
0.0000 |
−1.4116 |
−0.5874 |
由
(5)
对于所建立的ARIMA (2,1,1)模型,还需要对该模型的有效性进行检验。通过分析残差序列图和QQ图来检验,只有通过检验,才能利用该模型进行有效的预测。画出残差序列图和QQ图,如
由
通过建立的ARIMA (2,1,1)模型对平安银行2024年12月1日~2025年1月2日的数据进行预测,并与实际值进行对比,预测结果的评价指标如
评价指标 |
值 |
MAE |
0.1759 |
RMSE |
0.2113 |
MAPE |
1.4967 |
时间 |
真实值 |
预测值 |
相对误差(%) |
时间 |
真实值 |
预测值 |
相对误差(%) |
2024/12/1 |
11.3867 |
11.3947 |
0.07 |
2024/12/18 |
11.65 |
11.5053 |
1.24 |
2024/12/2 |
11.39 |
11.4009 |
0.10 |
2024/12/19 |
11.59 |
11.5118 |
0.67 |
2024/12/3 |
11.49 |
11.4081 |
0.71 |
2024/12/20 |
11.62 |
11.5183 |
0.88 |
2024/12/4 |
11.46 |
11.4146 |
0.40 |
2024/12/21 |
11.65667 |
11.5247 |
1.13 |
2024/12/5 |
11.44 |
11.4212 |
0.16 |
2024/12/22 |
11.69333 |
11.5312 |
1.39 |
2024/12/6 |
11.66 |
11.4276 |
1.99 |
2024/12/23 |
11.73 |
11.5377 |
1.64 |
2024/12/7 |
11.6633 |
11.4341 |
1.97 |
2024/12/24 |
11.86 |
11.5442 |
2.66 |
2024/12/8 |
11.6667 |
11.4406 |
1.94 |
2024/12/25 |
11.92 |
11.5506 |
3.10 |
2024/12/9 |
11.67 |
11.4471 |
1.91 |
2024/12/26 |
11.86 |
11.5571 |
2.55 |
2024/12/10 |
11.79 |
11.4600 |
2.78 |
2024/12/27 |
11.83 |
11.5636 |
2.25 |
2024/12/11 |
11.73 |
11.4695 |
2.22 |
2024/12/28 |
11.87 |
11.5701 |
2.53 |
2024/12/12 |
11.85 |
11.4765 |
3.24 |
2024/12/29 |
11.91 |
11.8965 |
0.11 |
2024/12/13 |
11.56 |
11.473 |
0.75 |
2024/12/30 |
11.95 |
11.783 |
1.39 |
2024/12/14 |
11.5633 |
11.4794 |
0.73 |
2024/12/31 |
11.7 |
11.5895 |
0.94 |
2024/12/15 |
11.5667 |
11.4859 |
0.70 |
2025/1/1 |
11.565 |
11.5959 |
0.27 |
2024/12/16 |
11.57 |
11.4924 |
0.67 |
2025/1/2 |
11.43 |
11.6024 |
1.51 |
2024/12/17 |
11.53 |
11.4989 |
0.27 |
如
本文利用ARIMA模型对平安银行股票的收盘价进行了预测研究。通过对训练集数据的平稳性检验、模型定阶和诊断检验,确定了ARIMA (2,1,1)模型为最优模型。模型预测结果显示,预测值与实际值之间的相对误差较小,MAE、RMSE和MAPE等评价指标均表明模型具有较高的预测准确性。ARIMA模型在短期股票价格预测中表现出色,能够为投资者提供有价值的参考信息。然而,股票市场受多种因素影响,未来研究可以结合其他模型或引入更多影响因素,以进一步提高预测精度。
2024-2025年重庆对外经贸学院科研项目:股票市场波动的统计特征分析与预测模型研究项目(KYZK2024042)。
*通讯作者。