基于ARIMA模型对中国1953~2015年GDP的分析建模及预测<sup> </sup>

Statistics and Application

2325-2251

Scientific Research Publishing

10.12677/SA.2017.62025

SA-21218

SA20170200000_78382448.pdf

数学与物理

基于ARIMA模型对中国1953~2015年GDP的分析建模及预测 Model and Forecast for China’s GDP from 1953 to 2015 Based on the ARIMA Model

郎

星宇

²¹李

鑫

²¹孙

弋茗

²¹白

晓东

²^*

大连民族大学，辽宁大连

null

* E-mail:baixd518@126.com(白晓);

10052017

0602219230

2014

This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/

本文从《中国统计年鉴》中选取中国1953年至2015年共63年的GDP作为数据，运用时间序列分析的基本分析方法——随机时序分析，对数据进行绘图分析、模型识别、参数估计、模型估计、模型拟合和检验，建立GDP时间序列模型，并对中国未来3年的经济发展做出预测，为政府制定经济发展战略提供依据。 This paper uses random time series method to analyze the data of China’s GDP from 1953 to 2015. By drawing, model recognition, parameter estimation, model estimation and model fitting, we establish GDP time series model and utilize it to predict the economic development of China in the next 3 years, and thus provide the basis for the government to formulate the economic development tragedy.

国内生产总值GDP，时间序列，ARIMA模型，预测, Gross Domestic Product Time Series ARIMA Model Forecast

基于ARIMA模型对中国1953~2015年GDP的分析建模及预测<sup> </sup> - beplay安卓登录

郎星宇，李鑫，孙弋茗，白晓东^*

大连民族大学，辽宁大连

收稿日期：2017年6月10日；录用日期：2017年6月25日；发布日期：2017年6月30日

摘要

本文从《中国统计年鉴》中选取中国1953年至2015年共63年的GDP作为数据，运用时间序列分析的基本分析方法——随机时序分析，对数据进行绘图分析、模型识别、参数估计、模型估计、模型拟合和检验，建立GDP时间序列模型，并对中国未来3年的经济发展做出预测，为政府制定经济发展战略提供依据。

关键词 :国内生产总值GDP，时间序列，ARIMA模型，预测

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 前言

上世纪80年代初，中国开始研究联合国国民经济核算体系的国内生产总值(GDP)指标。中国于1985年开始建立GDP核算制度。1993年，中国正式取消国民收入核算，GDP成为国民经济核算的核心指标。23年国家统计局宣布中国将改进GDP核算与数据发布制度，取消容易引起误解的预计数，建立定期修正和调整GDP数据的机制，在发布GDP数据的同时发布相关的重要数据，必要时还将公布核算方法。这是中国提高GDP数据的准确性和透明度，向国际通行办法迈进的重要一步 [1] 。

2014年国家统计局将积极稳妥的推进国家统一核算地区生产总值，深化固定资产投资统计，加快改进能耗统计进一步完善社会消费品零售统计，同时将精心组织实施第三次全国经济普查认真做好普查登记。尽快制定经济核算图，指定全国统一的核算办法，为2015年正式实施全国统一的核算GDP来打下一个基础。此举将有效消除近10年来各省GDP总和与国家统计局核算的全国GDP存在较大出入的情况。

2. 问题分析

中国1953~2015年的GDP数据可以看成一个时间序列，首先通过其时间序列图判断其是否为平稳时间序列，若不是则需要先进行对数据的预处理，之后初步提出分析模型，不断通过对模型识别、参数估计以及显著性检验等建立最优时间序列模型，并用来预测中国未来3年GDP的走势。

3. 名词解释

1) AIC准则：该准则适用于模型的适用性检验。其定义为：样本外预测误差方法的有效估计量，但受自由度约束较为严重，常用于预测模型的选择。

2) GDP：是指在一定时期内一个国家或地区经济中所生产出的全部最终产品和劳务的价值，常被公认为衡量国民经济发展、判断宏观经济运行状况的最佳指标。

3) ARIMA模型：自回归模型和滑动平均模型的组合，便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA，ARIMA模型的实质就是差分运算与ARMA模型的组合。公式为：

。

4. 模型的假设

1) 中国1953~2015年没有出现或遭遇重大改革等事件。

2) 采集的数据统计口径相同无太大误差。

流程图：如图1所示。

图1. 流程图

5. 时间序列模型的建立 5.1. 序列平稳性检验

若一个随机过程的统计特性不随时间的推移而变化，则称它为平稳随机过程。平稳性是一些时间序列具有的统计特征,对数据进行平稳性检验是分析时间序列的关键步骤。平稳时间序列有两种定义，根据限制条件的严格程度，分为严平稳时间序列和宽平稳时间序列。对序列的平稳性有两种检验方法，一种是根据时序图和自相关图显示的特征做出判断的图检验方法；一种是构造检验统计量进行假设检验的方法 [2] 。

5.1.1. 时序图检验及自相关图检验

由图2可以看出该序列有明显的递增趋势，所以它一定不是平稳序列。从图可以看出GDP在1978年之前一直很平稳的在2000~3000亿元波动，但1978年后具有很明显的上升趋势，到2000年以后更是迅猛增长，可以看出原始序列显然是非平稳的。这很符合中国的国情，改革开放以后中国的经济快速发展，故GDP也指数式快速增长 [3] 。

图3中我们发现序列的自相关系数递减到零的速度相当缓慢，在很长的延迟时期里，自相关系数一直为正，而后又一直为负，在自相关图中显示三角对称性，这是具有单调趋势的非平稳序列的一种自相关图形式。该序列并不平稳。

5.1.2. 差分

为了能够对序列进行分析，要使其平稳化。故将选择差分法，对序列进行平稳化处理，从而进一步分析预测。由差分的选择我们可以知道序列蕴含着曲线趋势，通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响，我们对原始数据进行一、二阶差分，并验证其平稳性。我们先进行一阶差分，即相距一期的两个序列值之间的减法运算()。如图4所示。

图2. 时序图

图3. 自相关图

图4. 差分后的序列的时序图

1阶差分序列时序图显示，1阶差分提取了原序列中的部分长期趋势，但长期趋势信息提取不充分，1阶差分后序列中仍蕴涵长期递增的趋势，于是对1阶差分后1阶差分后序列再做一次差分运算。检验结果表明差分后的序列是非平稳的，故还要再次进行差分计算，即二阶差分：，见图5。

由图6可知，我们可以确定二阶差分后序列平稳，时序图显示2阶差分比较充分地提取了原序列中蕴含的长期趋势，使得差分后序列不再呈现确定性趋势。所以，我们认为ARIMA模型的差分阶数d等于2。

5.2. 纯随机性检验

在将数据平稳化之后，还要判断序列是否有分析价值，必须对序列进行纯随机性检验，即白噪声检验。为了判断序列是否有分析价值，必须对序列进行纯随机性检验，即白噪声检验，因此在建模之前需要进行纯随机性检验。若是到平稳的白噪声序列，则该序列没有分析价值；若是平稳非白噪声序列，可进行模型拟合。

图5. 二阶差分时序图

图6. 差分后的自相关和偏自相关图

原假设：延迟期数小于或等于m期的序列值之间相互独立。

备择假设：延迟期数小于或等于m期的序列值之间有关联性。

当P值小于置信水平时，拒绝检验假设；而当P值大于置信水平时，不拒绝检验假设。在二阶差分后白噪声检验如图显示：

LB统计量的P值 = 0.00125，小于0.05，所以可以断定二阶差分序列属于非白噪声序列。结合前面的平稳性检验结果，说明该序列是平稳非白噪声序列，可进行模型拟合。

5.3. 时间序列模型的建立 5.3.1. 系统定阶

为了尽量避免因个人经验不足而导致的模型识别不准确的问题，R提供了auto.arima函数。如前所述，ARIMA模型有(p, d, q) 3个参数，在此我们采用auto.arima函数定阶。

经过上述过程，拟合ARIMA (2, 2, 1)模型。

5.3.2. 拟合模型检验

模型的显著性检验主要是检验模型的有效性。一个模型是否显著有效主要看他提取的信息是否充分。一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息，换言之，拟合残差项中将不再蕴涵任何相关信息，即残差序列应该为白噪声序列，这样的模型称为显著有效模型。反之，如果残差序列为非白噪声序列，那就意味着残差序列中还残留着相关信息未被提取，这就说明拟合模型不够有效，通常还需要选择其他模型，重新拟合。所以模型的显著性检验即为残差序列的白噪声检验 [4] 。

LB统计量P = 0.9721和P = 0.9958均显著大于α (α = 0.05)，可知残差通过了白噪声检验，即认为残差序列为白噪声序列，该拟合模型显著有效。

我们可以根据自相关图和偏自相关图拟合(3, 2, 1)模型，检验结果：

拟合(3, 2, 2)模型，检验结果如下：

P值均显著大于α，可知残差均通过了白噪声检验，即认为残差序列为白噪声序列。

5.3.3. 模型优化

AIC准则为选择最优模型提供了有效的规则，在所有通过检验的模型中使得AIC函数达到最小的模型为相对最优模型。

由图可知，ARIMA (2, 2, 1)模型使得AIC值最小，为1232.33，所以ARIMA (2, 2, 1)模型为相对最优模型。

5.4. 预测未来3年GDP走势及分析

所谓预测，就是要利用序列以观测到的样本值对序列在未来某个时刻的取值进行估计。目前对平稳序列最常用的预测方法是线性最小方差预测。线性是指预测值为观测值序列的线性函数，最小方差是指预测方差达到最小 [5] [6] 。

利用此模型对国内生产总值之后3年的GDP 进行预测结果如下：

可以从图7看出，模型拟合效果很好，国内生产总值在未来3年内还是会稳定地上涨。

图7. 预测图

6. 模型的评价 6.1. 模型的优点

1) 本文巧妙运用流程图,将建模思路完整清晰的展现出来。

2) 国民生产总值(GDP)受经济基础、人口增长、资源、科技、环境等诸多因素的影响，这些因素之间又有着错综复杂的关系，因此，运用结构性的因果模型分析和预测GDP往往比较困难。将历年的GDP作为时间序列，根据过去的数据得出其变化规律，建立预测模型，有着重要的意义。

3) 建立模型的过程中运用了R统计软件，结果准确并提高了工作效率。

6.2. 模型的缺点

1) 本文没有考虑GDP数据的周期性和季节性，如果能从这方面详细研究，一定能对GDP序列的发展变化规律做出更为准确地分析。

2) 对GDP的预测本文只建立了ARIMA这一种模型，缺乏与其他模型的比较。

3) 本文仅以GDP的变化为视角，并在该视角下，力图达到对经济运行较为准确的预测。但由该模型得出的预测结果只是一个预测值，而国民经济是一个复杂多变的动态系统，当国家的宏观政策发生调整，发展环境发生改变时都会使宏观经济指标出现相应地变化。

7. 总结

本文根据1953~2015年中国的国内生产总值(GDP)的统计资料，针对GDP的非平稳特征，通过差分变成平稳序列，建立GDP时间序列的ARIMA模型，并在此基础上用于国内生产总值GDP的预测分析。计算结果表明，该模型能较好地解决国内生产总值GDP的估计和预测问题，预测精度较为精确。

基金项目

辽宁省自然科学基金面上项目资助(201602188)；国家级大创项目资助(G201612026032)；校级大创项目(XA201609241)。

文章引用

郎星宇,李鑫,孙弋茗,白晓东. 基于ARIMA模型对中国1953~2015年GDP的分析建模及预测 Model and Forecast for China’s GDP from 1953 to 2015 Based on the ARIMA Model[J]. 统计学与应用, 2017, 06(02): 219-230. http://dx.doi.org/10.12677/SA.2017.62025

参考文献 (References)

map

References 1

刘薇. 时间序列分析在吉林省GDP预测中的应用[D]: [硕士学位论文]. 长春: 东北师范大学, 2009

王燕. 应用时间序列分析[M]. 第三版. 北京: 中国人民大学出版社.

张丽. 天津市人均GDP时间序列模型及预测[J]. 北方经济, 2007(6): 44-46.

刘自强, 王效岳, 白如江. 基于时间序列模型的研究热点分析预测方法研究[J]. 情报理论与实践, 2016, 39(5): 27-33.

朱莹. 基于ARMA模型对江苏省1979-2014年GDP的分析建模及预测[J]. 江苏商论, 2017(2): 60-61.

王坚, 汪卫. 一种基于ARIMA模型的钢铁产品销售预测方法[J]. 企业信息化技术, 2017(41): 18-23.