本文立足于对时间序列数据的研究分析,以深粮控股的股价数据为实验对象,采用一种基于差分自回归移动平均(ARIMA)模型对其未来几天的股票价格进行预测。用python和Eviews对采集的股票价格数据进行平稳性检验、白噪声检验、模型定阶、残差检验等步骤。建立了有效预测股票价格的ARIMA模型,同时结合真实值,对模型的有效性进行检验。结果表明,该方法能有效提取原始数据中心的信息,对股票价格预测效果较好。 Based on the research and analysis of time series data, this paper adopts a differential autoregres-sive moving average (ARIMA) model to predict the stock price of SZG Holdings in the coming days based on its stock price data as the experimental object. Firstly, the collected stock price data were tested for smoothness, white noise test, model sizing and residual test by using python and Eviews, and then an ARIMA model was established to effectively predict the stock price, while the validity of the model was tested by combining the true values. The results show that the method can effective-ly extract information from the center of the original data and has a good effect on stock price pre-diction.
本文立足于对时间序列数据的研究分析,以深粮控股的股价数据为实验对象,采用一种基于差分自回归移动平均(ARIMA)模型对其未来几天的股票价格进行预测。用python和Eviews对采集的股票价格数据进行平稳性检验、白噪声检验、模型定阶、残差检验等步骤。建立了有效预测股票价格的ARIMA模型,同时结合真实值,对模型的有效性进行检验。结果表明,该方法能有效提取原始数据中心的信息,对股票价格预测效果较好。
时间序列,股票价格,ARIMA模型,预测
Lu Luo
School of Applied Mathematics, Chengdu University of Information Technology, Chengdu Sichuan
Received: Nov. 26th, 2022; accepted: Dec. 21st, 2022; published: Dec. 30th, 2022
Based on the research and analysis of time series data, this paper adopts a differential autoregressive moving average (ARIMA) model to predict the stock price of SZG Holdings in the coming days based on its stock price data as the experimental object. Firstly, the collected stock price data were tested for smoothness, white noise test, model sizing and residual test by using python and Eviews, and then an ARIMA model was established to effectively predict the stock price, while the validity of the model was tested by combining the true values. The results show that the method can effectively extract information from the center of the original data and has a good effect on stock price prediction.
Keywords:Time Series, Stock Prices, ARIMA Model, Forecasting
Copyright © 2022 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
金融市场在国家经济体系中扮演着至关重要的角色,金融市场的表现反映着国家经济发展状态,挖掘金融市场变化的潜在规律并准确的判断金融市场的发展趋势,有利于相关从业者制定更完善的策略,达到降低风险,提高效益的目的 [
一直以来,股票在金融市场中有着举足轻重的地位,而股票价格往往对时间因素非常敏感 [
ARIMA模型即差分移动平均自回归(Autoregressive Integrated Moving Average)模型,主要被用于拟合具有平稳属性的时间序列,或者是可以转换为具有平稳属性的时间序列,是目前广泛为学者应用的时间序列拟合方法 [
φ ( B ) ∇ d y t = θ ( B ) ε t E ( ε t ) = 0 , var ( ε t ) = σ ε 2 , E ( ε t ε s ) = 0 , s ≠ t E ( y s ε t ) = 0 , ∀ s < t . (1)
其中, ∇ d = ( 1 − B ) d ; φ ( B ) = 1 − φ 1 B − ⋯ − φ p B p 、 θ ( B ) = 1 − θ 1 B − ⋯ − θ p B q 分别为平稳可逆ARIMA(p,q)模型的自回归系数多项式和移动平均系数多项式。其中自回归(AR(p))、移动平均(MA(q))、自回归移动平均(ARMA(p,q))模型都是ARIMA(p,d,q)模型的一个特例。当 q = d = 0 且 p ≠ 0 时,ARIMA(p,0,0)即为AR(p)模型;当 p = d = 0 且 q ≠ 0 时,ARIMA(0,0,q)即为MA(q)模型;当 d = 0 且 p ≠ 0 , q ≠ 0 时,ARIMA(p,0,q)即为ARMA(p,q)模型 [
模型 | 自相关系数ACF | 偏自相关系数PACF |
---|---|---|
ARIMA(p,d,0) | 拖尾 | p阶截尾 |
ARIMA(0,d,q) | q阶截尾 | 拖尾 |
ARIMA(p,d,q) | 拖尾 | 拖尾 |
表1. ARIMA(p,d,q)定阶规则
大致来讲,ARIMA模型构建大约需要几个步骤,如下图1所示:
图1. ARIMA模型构建流程图
平稳性检验。时间序列的平稳性代表时间序列的统计性质关于时间平移的不变性。对原始股票价格数据进行平稳性检验时,如果数据为非平稳时间序列,需要对序列进行差分运算,直至序列平稳 [
白噪声检验(纯随机性检验)。序列的各项数值之间不相关,序列在进行完全无序的随机波动,这样的序列称为纯随机时间序列(白噪声序列)。纯随机时间序列是没有信息可提取的序列,如果序列为白噪声序列,应当停止分析 [
模型定阶(模型识别)。结合数据样本时序图和AIC信息准则,确定模型自回归系数p和移动平均系数q的最优组合 [
模型拟合。根据已经确定的最优参数p和q,对平稳非白噪声时间序列进行拟合,构建ARIMA(p,d,q)模型。
模型检验。对模型进行显著性(有效性)检验,检验模型是否将样本信息进行充分提取。当模型检验为无效模型时,重复步骤三,直至模型有效 [
本实验所采集数据均来自tushare金融大数据社区,通过python连接API接口获得。实际选取了深粮控股的收盘价2021年12月6日至2022年7月15日共147个数据样本。
为保证数据的可靠性和有效性,本文数据全部选自tushare金融大数据社区,然后对其缺失值和异常值进行了处理,对缺失值全部采用上一个交易日的数据,对异常值作删除处理。
首先,对原始数据进行平稳性检验,观察原序列的时序图如图2所示。
观察图2,可见其为非平稳序列,不过为避免肉眼观察的主观性,再对原始序列进行ADF单位根检验。即序列若存在单位根,则不平稳。ADF单位根检验结果如表2所示,由表可知,检验统计量 adf = − 0.002086 > − 1.61527 > − 1.943012 > − 2.580788 ,且 P = 0.6504 > 0.05 = α ,不能拒绝原假设,故判断原序列非平稳。
ARIMA模型建模要求必须为平稳的时间序列,因此对原序列进行一阶差分,再对一阶差分后的序列进行ADF检验,结果如表3所示:
图2. 原始数据时序图
adf | P | 显著性水平 | ||
---|---|---|---|---|
1% | 5% | 10% | ||
−0.002086 | 0.6804 | −2.580788 | −1.943012 | −1.615270 |
表2. 原序列ADF检验结果
adf | P | 显著性水平 | ||
---|---|---|---|---|
1% | 5% | 10% | ||
−13.18717 | 0 | −2.580788 | −1.943012 | −1.615270 |
表3. 一阶差分后序列ADF检验结果
观察图3差分后序列已平稳,由表3,检验统计量 adf = − 13.18717 < − 2.580788 < − 1.943012 < − 1.61527 ,且 P 值 = 0 < 0.05 = α ,拒绝原假设,故判断序列平稳,可以用于建模。
图3. 一阶差分后序列时序图
一阶差分后序列平稳,故确定 d = 1 ,模型的定阶就是估计自回归阶数p和移动平均阶数q的过程。图4为差分后序列的自相关和偏自相关图,观察图4可知,ACF和PACF均拖尾,判断为ARMA模型,初步判断取 p = q = 5 。为进一步确定更合适的p和q取值,运用AIC信息准则估计不同阶数对模型拟合精度的影响,如表4所示,综合结果选择 p = q = 5 ,建立ARIMA(5,1,5)模型。
图4. 差分后序列ACF和PACF图
p | d | q | AIC |
---|---|---|---|
2 | 1 | 2 | 11.361 |
1 | 1 | 1 | 11.789 |
1 | 1 | 0 | 9.968 |
5 | 1 | 5 | 0.016 |
表4. 不同阶数对应的AIC值
根据上文,建立ARIMA(5,1,5)模型进行拟合,结果如图5所示,模型对应的 P 值 = 0 < 0.05 = α ,故模型显著有效。进行参数估计,并写出对应表达式为:
Y t = − 0.371419 y t − 3 − 0.335192 y t − 5 + 0.384267 ε t − 3 + 0.614337 ε t − 5 + ε t . (2)
模型的显著性检验主要检验模型的有效性,即拟合模型是否充分提取观测值序列中所有的样本相关信息。当拟合模型为有效模型时,残差序列 ε t 不存在任何相关性,即残差序列 ε t 为白噪声序列。对模型进行残差检验,由图6, P 值 = 0 > 0.05 = α ,故不能拒绝原假设,即残差为白噪声序列,模型显著有效。
此外,DW(Durbin_Waston)检验也是检验残差的自相关方法 [
图5. ARIMA(5,1,5)拟合结果
图6. 残差序列自相关图
观察图7,模型的残差序列值基本拟合在直线y = 0附件呈对称分布,因此,也可判断残差序列不存在自相关。
图7. 最终效果图
由表5可知,由上表可知,预测误差率均控制在5%以内,虽仍有些许误差,但预测值的误差相对较小,在可控范围内,即认为该模型具有较好的拟合效果。
日期 | 实际值 | 预测值 | 误差 |
---|---|---|---|
2022-07-18 | 7.43 | 7.327237 | 1.38% |
2022-07-19 | 7.54 | 7.296828 | 3.22% |
2022-07-20 | 7.58 | 7.305444 | 3.62% |
2022-07-21 | 7.52 | 7.267384 | 3.35% |
2022-07-22 | 7.49 | 7.199295 | 3.88% |
表5. 模型预测结果
股票价格预测一直备受瞩目,本文采用ARIMA对所选取的数据样本进行了预测,介绍了建模的基本方法和步骤,通过平稳性,白噪声等检验,构建了ARIMA并进行了预测。结果表明,该预测方法是可靠的,对原序列信息提取充分,拟合效果较好。但也看到预测值较真实值偏小,且预测期数越长误差越大。因此相关从业者可选择此方法进行短期预测,以为其相关投资决策作为参考。
罗 露. 基于ARIMA模型的股票价格预测分析Stock Price Forecasting Analysis Based on ARIMA Model[J]. 应用数学进展, 2022, 11(12): 9096-9102. https://doi.org/10.12677/AAM.2022.1112959
https://doi.org/10.1111/exsy.12164