能源的使用与社会生产生活有着密切的联系,对此能源消费量的准确预测对于制定能源生产和消费规划以及保持中国经济健康、持续发展具有极其重要的理论与现实意义。本文采用ARIMA模型,利用中国1990~2019年的能源消费量进行时间序列建模,2020~2021年能源消费量数据进行测试。通过相关的检验和分析,疏系数ARIMA((5),2,1)模型的拟合效果较好,对比2020和2021年真实数据发现预测平均误差仅为0.835%,因此利用该模型对中国未来三年的能源消费量进行预测。预测结果表明,未来三年中国能源消费量仍然增加,但是增长速度放缓,符合中国当前低碳经济发展背景。 The use of energy is closely related to social production and social life, the accurate prediction of energy consumption for the development of energy production and consumption planning, keeping China’s economy healthy and sustainable development has the extremely important theoretical and practical significance. In this paper, ARIMA model is adopted to conduct time series modeling with China’s energy consumption from 1990 to 2019, and the data of energy consumption from 2020 to 2021 are used for testing. Through relevant testing and analysis, ARIMA((5),2,1) model has a good fitting effect. Compared with the real data of 2020 and 2021, it is found that the average error of prediction is only 0.835%. Therefore, this model is used to forecast the energy consumption of China in the next three years. The prediction results show that in the next three years, China’s energy consumption will still increase, but the growth rate will slow down, which is in line with China’s current low-carbon economic development background.
能源的使用与社会生产生活有着密切的联系,对此能源消费量的准确预测对于制定能源生产和消费规划以及保持中国经济健康、持续发展具有极其重要的理论与现实意义。本文采用ARIMA模型,利用中国1990~2019年的能源消费量进行时间序列建模,2020~2021年能源消费量数据进行测试。通过相关的检验和分析,疏系数ARIMA((5),2,1)模型的拟合效果较好,对比2020和2021年真实数据发现预测平均误差仅为0.835%,因此利用该模型对中国未来三年的能源消费量进行预测。预测结果表明,未来三年中国能源消费量仍然增加,但是增长速度放缓,符合中国当前低碳经济发展背景。
能源消费量,时间序列模型,疏系数模型,预测
Chen Chen
Yunnan University of Finance and Economics, Kunming Yunnan
Received: Jan. 21st, 2023; accepted: Feb. 11th, 2023; published: Feb. 23rd, 2023
The use of energy is closely related to social production and social life, the accurate prediction of energy consumption for the development of energy production and consumption planning, keeping China’s economy healthy and sustainable development has the extremely important theoretical and practical significance. In this paper, ARIMA model is adopted to conduct time series modeling with China’s energy consumption from 1990 to 2019, and the data of energy consumption from 2020 to 2021 are used for testing. Through relevant testing and analysis, ARIMA((5),2,1) model has a good fitting effect. Compared with the real data of 2020 and 2021, it is found that the average error of prediction is only 0.835%. Therefore, this model is used to forecast the energy consumption of China in the next three years. The prediction results show that in the next three years, China’s energy consumption will still increase, but the growth rate will slow down, which is in line with China’s current low-carbon economic development background.
Keywords:Energy Consumption, Time Series Model, Sparse Coefficient Model, Forecast
Copyright © 2023 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
能源的使用是各行业必发展必不可少的要素投入,是国民经济和环境可持续发展的关键因素。随着经济的增长,能源消费总量的也在逐年攀升,从能源供需角度来看,由图1可知1990~2021年中国能源消费量一直在持续增长,在1990~2000年的增长速度一直较慢,从2001年开始突然增长速度加快,在2008年增长减缓,但是之后消费的增速又再次升高。其主要原因可能是受到2008年发生的世界金融危机影响,此时全国的经济增长速度放缓,由此能源市场业的需求降低能源消费量下降。在渡过世界金融危机后市场回归正常,能源消费量增长速度也恢复。进一步从能源使用排放角度来看,能源大量消耗的同时会产生许多污染物,例如二氧化碳等。当前中国为控制二氧化碳排放、应对全球气候变暖提出了“双碳”目标,但是中国的能源储备情况造就了中国能源消费结构将长期以煤炭为主,而煤炭的燃烧又会对生态环境、以及“双碳”目标的实现带来一系列的环境问题。
图1. 能源消费总量时序图
能源的使用与社会生产生活有着密切的联系,在当前的低碳经济环境下,中国能源大量消耗带来的资源、环境等问题已经不容忽视。本文利用最新的能源消费数据,通过构建时间序列模型对能源消费总量进行拟合及预测。有效预测能源消费量以及变化趋势,对制定能源生产和消费规划以及保持中国经济健康、持续发展具有极其重要的理论与现实意义。
通过对预测能源消费量的相关文献进行梳理,从研究方法角度将文章分为两类:第一类,依靠统计学方法的传统预测方法,包括时间序列法、回归分析法、灰色系统等方法。
其中时间序列法是运用变量的历史数据推测未来的发展趋势,主要为ARIMA模型,但是该模型只适用于短期预测,应用于中长期预测时误差较大。例如张峰和刘伟 [
回归分析法是考虑到其他变量对于能源消费量的影响而建立的回归方程用于预测能源消费量。如张露 [
灰色预测法是通过灰色理论进行预测,适合中短期预测。其特点是可以处理数据量少、信息不充足的系统,适用于指数增长模型,通常用模型GM(1,1)。如陈洪涛和周德利 [
第二类,非线性预测方法。传统模型大多基于线性假设,但是随着预测模型的发展,出现了利用计算机对数据训练以此预测的非线性模型,如神经网络、支持向量机(SVR)等方法,具有非线性的特点。如邢文婷 [
综上可知,各种预测方法均有自己的特点,需要根据数据再选择方法,考虑到能源消费量数据情况以及预测结果的精准度,本文采用ARIMA模型对能源消费量进行预测,该模型对于短期预测较为精准且可以对时间序列数据的结构和特征有本质上的认识 [
差分自回归移动平均模型(ARIMA模型)是以随机理论为基础的时间序列预测方法。该模型的基本思想是在t时刻变量xt可以由过去的自身数值和随即误差项解释,即不需要建立因果关系,只需要研究对象的过往数据就可以建模。由于现实中时间序列数据大多情况下是不平稳的,可以通过对数据进行差分使得数据平稳,模型的形式为 [
{ Φ ( B ) ∇ d x t = Θ ( B ) ε t E ( ε t ) = 0 , v a r ( ε t ) = σ ε 2 , E ( ε t ε s ) = 0 , s ≠ t E ( x s ε t ) = 0 , ∀ s < t
式中, ∇ 为差分算子, ∇ x t = x t − x t − 1 ;B为延迟算子, x t − p = B p x t ; ∇ d = ( 1 − B ) d , Φ ( B ) = 1 − ϕ 1 B − ⋯ − ϕ p B p 为平稳可逆ARMA(p,q)模型的自回归系数多项式, Θ ( B ) = 1 − θ 1 B − ⋯ − θ p B p 为平稳可逆ARMA(p,q)模型
的移动平滑系数多项式。
利用数据拟合得到的模型应当检验参数是否显著为0,参数检验的假设条件为:
H 0 : β j = 0 ∀ 1 ≤ j ≤ m
H 1 : β j ≠ 0 ∀ 1 ≤ j ≤ m
此处选择t统计量:
t = n − m β ^ j a j j Q ( β ˜ ) ~ t ( n − m )
若拒绝原假设,认为该参数显著不为0,否则认为该参数不显著,这时应当剔除不显著参数 [
对于差分平稳后的序列如果是白噪声,则没有回归的必要;对于拟合模型若已经全部提取所有信息,则残差序列应当为白噪声 [
H 0 : ρ 1 = ρ 2 = ⋯ = ρ m = 0 , ∀ m ≥ 1
H 1 : 至 少 存 在 某 个 ρ k ≠ 0 , ∀ m ≥ 1 , k ≤ m
此处选取LB统计量做白噪声检验:
LB = n ( n + 2 ) ∑ k = 1 m ρ ^ k 2 n − k ~ χ 2 ( m )
其中,n为观测期数;m为指定延迟期数。
本文目的是预测中国能源消费总量,此处能源消费总量是指一定地域内,国民经济各行业和居民家庭在一定时期消费的各种能源转化为标准煤的总和。包括:原煤、原油、天然气、洗煤、焦炭、电力等各种能源。数据来源于《中国统计年鉴》和国家统计局。取1990~2021年中国能源消费总量进行分析,利用1990~2019年数据进行建模,2020、2021年数据作为检验数据,并预测未来三年的能源消费量。
由图1能源消费总量时序图可知,能源消费总量数据呈逐步上升的趋势,故数据不平稳,需要对该序列进行处理。对我国能源消费量 x t 数据利用ADF单位根检验做平稳性检验,原序列和一阶差分序列均不平稳,二阶差分后得到 Δ 2 x t 序列平稳。但是观察 Δ 2 x t 的时序图,如图2所示,除去2008年金融危机影响产生的异常,数据显示存在一定的异方差,因此考虑将数据做对数变换以消除异方差。
图2. 原序列二阶差分时序列图
对中国能源消费量 x t 取对数以消除异方差性,用 ln x t 表示。利用ADF单位根检验以确定 ln x t 序列的平稳性,检验结果如表1,根据结果可知 Δ 2 ln x t 平稳。
序列 | 检验形式 | ADF检验值 | P值 | 检验结果 |
---|---|---|---|---|
ln x t | 无常数均值无趋势项 | 7.57 | 0.990 | 不平稳 |
有常数均值无趋势项 | −0.844 | 0.738 | ||
有常数均值有趋势项 | −0.49 | 0.976 | ||
Δ ln x t | 无常数均值无趋势项 | −1.02 | 0.307 | 不平稳 |
有常数均值无趋势项 | −1.61 | 0.471 | ||
有常数均值有趋势项 | −1.65 | 0.698 | ||
Δ 2 ln x t | 无常数均值无趋势项 | −3.72 | 0.010 | 平稳 |
有常数均值无趋势项 | −3.65 | 0.013 | ||
有常数均值有趋势项 | −3.59 | 0.050 |
表1. ADF检验结果
对 Δ 2 ln x t 平稳序列做白噪声检验,以保证数据拟合模型具有意义。在延迟5阶时的LB统计量对应的p值 = 0.04788 < 0.05,说明序列非白噪声序列,可以进行拟合。
由平稳性检验结果可知,应该建立ARIMA(p,2,q)模型。进一步还需要考察序列的自相关系数(ACF)和偏自相关系数(PACF),以此确定p、q值。 Δ 2 ln x t 的ACF和PACF如图3所示,除了延迟5阶的自相关系数外其余系数均在2倍标准差范围内,可以判断该序列有短期相关性且在5阶截尾。同理可知,偏自相关系数也是在5阶截尾。
图3. 自相关和偏自相关图
同一个序列可以构造多个拟合模型,因此应当充分考虑p、q的各种取值情况,构建多个拟合模型。因为 Δ 2 ln x t 的ACF和PACF均在5阶截尾,综合考虑认为可以尝试模型 [
对上述模型通过RStudio软件利用最小二乘和极大似然估计混合方法进行拟合,并对模型参数在10%置信水平下进行参数的显著性检验,最终仅有ARIMA(5,2,0)、ARIMA((5)),2,0)、ARIMA((5)),2,1)、ARIMA(0,2,(5))、ARIMA(1,2,(5))以上五个模型通过系数显著性检验,回归结果见表2。
再对通过参数检验的上述五个模型进行模型的显著性检验,即对其残差序列进行白噪声检验。表2中p值为对拟合模型的残差利用LB统计量做白噪声检验滞后6阶和12阶的p值,结果显示残差序列均为白噪声序列,通过模型的显著性检验。
ARIMA(5,2,0) | ARIMA((5)),2,0) | ARIMA((5)),2,1) | ARIMA(0,2,(5)) | ARIMA(1,2,(5)) | |
---|---|---|---|---|---|
x t − 1 | 0.3425 | 0 | 0 | 0 | 0.2995 |
x t − 2 | −0.1686 | 0 | 0 | 0 | 0 |
x t − 3 | −0.1941 | 0 | 0 | 0 | 0 |
x t − 4 | 0.2205 | 0 | 0 | 0 | 0 |
x t − 5 | −0.5144 | −0.4179 | −0.4654 | 0 | 0 |
ε t − 1 | 0 | 0 | 0.3867 | 0 | 0 |
ε t − 2 | 0 | 0 | 0 | 0 | 0 |
ε t − 3 | 0 | 0 | 0 | 0 | 0 |
ε t − 4 | 0 | 0 | 0 | 0 | 0 |
ε t − 5 | 0 | 0 | 0 | −0.4494 | −0.4456 |
AIC | −130.41 | −131.52 | −133.66 | −131.46 | −132.18 |
p值 | 0.9918 0.9743 | 0.4321 0.7838 | 0.8156 0.9868 | 0.3678 0.6491 | 0.5479 0.8109 |
表2. 模型回归结果
对于通过模型检验的有效拟合模型本文通过AIC信息准则进一步对模型优化,以期选择最优的模型对序列进行拟合和预测。AIC信息准则是AIC的值越小越好,由表2中可知,认为ARIMA((5)),2,1)模型拟合中国能源消费总量的效果较好,模型拟合结果为:
( 1 − B ) 2 ln x t = 1 + 0.3867 B 1 + 0.4654 B 5 ε t
进一步对该模型的残差做LM检验和PortmanteauQ检验,以检验异方差,检验结果如表3所示,结果显示不拒绝原假设,残差序列方差齐性,说明没有异方差,同时说明将数据取对数后可以消除异方差,模型拟合较好。
检验方法 | Chi/X-squared | df | p值 |
---|---|---|---|
LM检验 | 0.04346 | 1 | 0.8349 |
0.39156 | 2 | 0.8222 | |
0.60786 | 3 | 0.8946 | |
0.63078 | 4 | 0.9596 | |
0.79565 | 5 | 0.9773 | |
Portmanteau Q检验 | 0.04332 | 1 | 0.8351 |
0.37205 | 2 | 0.8303 | |
0.56682 | 3 | 0.9040 | |
0.5887 | 4 | 0.9643 | |
0.64414 | 5 | 0.9859 |
表3. 异方差检验结果
用ARIMA((5)),2,1)对中国2020~2024年的能源消费总量进行预测,预测结果见表4,得到的预测图见图4。由表4可知,2020年和2021年的预测值分别为505306.27万吨标准煤和522938.95万吨标准煤,与实际值的相对误差分别为1.47%和0.20%,说明预测结果与实际值相对接近,并且对于2021年预测误差下降仅为0.20%,存在预测精度变高的情况,进一步说明选择的模型可以较为准确的对未来能源消费量进行预测。同时由图4可知拟合结果较好,其中图4中黑色虚线为预测值,红色实线为预测值。
时间 | 2020 | 2021 | 2022 | 2023 | 2024 |
---|---|---|---|---|---|
预测值(万吨标准煤) | 505306.27 | 522938.95 | 537390.34 | 551540.20 | 566657.31 |
实际值(万吨标准煤) | 498000 | 524000 | |||
相对误差(%) | 1.47 | 0.20 |
表4. 预测结果
图4. 能源消费量对数和能源消费量的预测图
ARIMA模型可以作为预测中国能源消费总量的工具,并且预测精度较好。通过预测结果可以看出在未来2022~2024年中国能源消费总量仍然在持续增长。在2021~2024年能源消费总量将以3.49%、2.76%、2.63%、2.74%的增长率增长,可以看出能源增长速度有所放缓,符合中国当前低碳经济背景。目前中国很难摆脱以煤炭为主的能源消费情况,但是可以通过:
1) 加强科技创新。科技创新可以加快新能源与清洁能源的开发,同时还可以提高能源使用效率使得在同产出下能源消耗更少。
2) 有关部门制定相应促进节能政策,如在国外已经实行的碳税与碳交易政策,其中碳税政策是否可以借鉴国外经验并转化为适合中国国情的节能减排政策。其次中国的碳交易市场已经从部分试点到全国推行,应当在继续推行的同时做好其他辅助工作以使得达到节能减排作用。
3) 提高居民低碳意识,通过各种宣传途径大力推广低碳环保的好处,倡导居民绿色低碳生活。
陈 琛. 基于时间序列模型的短期中国能源消费量预测研究Short-Term Energy Consumption Forecasting in China Based on Time Series Model[J]. 统计学与应用, 2023, 12(01): 164-172. https://doi.org/10.12677/SA.2023.121018