随着社会的发展,我们对能源的需求变得越来越大。截止到2018年,我国的能源消费总量达到464,000万吨标准煤。能源对于一个国家的经济发展非常重要。本文分别用多元线性回归模型和ARMA模型对能源消费总量进行预测。通过合理的方法来预测我国能源消费总量的未来发展趋势,对于我国能源部门制定有效合理的能源消费政策具有一定的现实意义。 With the development of society, our demand for energy is growing. By 2018, China’s total energy consumption has reached 4640 million tons of standard coal. Energy is very important for a coun-try’s economic development. In this paper, multiple linear regression model and ARMA model are used to predict the total energy consumption. It is of practical significance for China’s energy sector to formulate effective and reasonable energy consumption policies to predict the future de-velopment trend of China’s total energy consumption through reasonable methods.
李悦,崔玉杰
北方工业大学理学院,北京
收稿日期:2019年11月16日;录用日期:2019年12月4日;发布日期:2019年12月11日
随着社会的发展,我们对能源的需求变得越来越大。截止到2018年,我国的能源消费总量达到464,000万吨标准煤。能源对于一个国家的经济发展非常重要。本文分别用多元线性回归模型和ARMA模型对能源消费总量进行预测。通过合理的方法来预测我国能源消费总量的未来发展趋势,对于我国能源部门制定有效合理的能源消费政策具有一定的现实意义。
关键词 :能源消费总量,多元线性回归,ARCH模型
Copyright © 2020 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
能源是人类赖以生存的物质基础。随着时代的发展和社会的进步,我们对能源的需求量变得越来越大。1999年我国的能源消费总量为140,569万吨标准煤,经过20年的发展,2018年我国的能源消费总量高达464,000万吨标准煤,是1999年的2.3倍。由此导致了我国能源供给紧张的形势。能源在一个国家的经济中占据很重要的地位。因此,采用合理的方法准确地预测能源消费的未来发展趋势,能够为有关能源部门制定合理化的能源消费政策提供建议,同时可以促进我国经济健康发展,具有一定的现实意义。
王倩(2018)通过对我国能源消费现状进行分析,发现我国在过去几十年里能源消费达到了很高的程度,需要对我国的能源消费进行优化策略 [
由图1我们可以看到从1999年到2018年我国的能源消费总量是逐年递增的,2018年我国的能源消费总量已经达到了464,000万吨标准煤。在这期间,2004年的增速最快,为16.84%;2015年的增速最慢,为0.96%。
图1. 1999年~2018年中国能源消费总量变化图
由图2可以看到我国主要能源品种有煤炭、石油、天然气、水电、核电、风电。其中煤炭和石油这两种能源品种所占的比重相对较大,同时我们看到随着科技的不断发展,考虑到保护环境的重要性,水电、核电、风电所占比重逐渐变大。
图2. 2000年~2018年中国主要品种能源消费结构图
本次研究共收集了1999年到2018年共20年的能源消费总量相关数据,为了去量钢化,本文采用全序列法,全序列功效系数的形式如下:
x i j ∗ ( t k ) = ϕ + x i j ( t k ) − min i , k { x i j ( t k ) } max i , k { x i j ( t k ) } − min i , k { x i j ( t k ) } × φ
x i j ∗ ( t k ) 为第i个对象第j项指标在 t k 时刻的无量化数据。本文取 ϕ = 0 , φ = 1 。
多元线性回归模型是一元线性回归模型的推广。用回归方程定量刻画一个因变量y的均值与多个自变量 x 1 , x 2 , ⋯ , x p 存在线性关系,多元线性回归模型的形式如下:
y i = β 0 + β 1 x 1 + β 2 x 2 + ⋯ + β p x p + ε
y被称为因变量或者被解释变量, x 1 , x 2 , ⋯ , x p 被称为自变量或者解释变量, β 0 , β 1 , β 2 , ⋯ , β p 被称为回归系数, ε 服从均值为0,方差为
逐步回归分析方法通过将所有自变量对因变量的影响程度从大到小依次逐个引入方程中,同时引入一个变量就对模型中的所有变量进行检验,不显著的变量剔除,保证模型中的含有自变量对因变量都是显著的。
将能源消费总量(万吨标准煤) (CON)作为因变量。同时找到了影响我国能源消费总量的经济因素和社会因素,分别为:城镇化率(%) (URB)、固定资产投资(亿元) (INV)、国内生产总值(亿元) (GDP)、研究与试验经费发展支出(亿元) (EXP)、第三产业所占比重(%) (TER)。运用SPSS软件,采用逐步回归的方法建立回归方程,输出结果如下。
Model | Unstandardized Coefficients | t | Sig. | |
---|---|---|---|---|
B | Std. Error | |||
(Constant) | −0.037 | 0.009 | −4.220 | 0.001 |
URB | 1.493 | 0.042 | 35.969 | 0.000 |
TER | −0.457 | 0.044 | −10.380 | 0.000 |
表1. 回归系数表
由表1我们可以看出城镇化率(URB)、第三产业所占比重(TER)这两个变量进入模型,其他变量都未进入,两个变量t检验的P值都是小于0.05的,说明回归方程线性显著。得到的回归方程为:
C O ^ N = − 0.037 + 1.493 URB − 0.457 TER
由表2可以看到复相关系数、判定系数和调整的判定系数,三者均大于0.9,说明模型的拟合效果很好。
Model | R | R Square | Adjusted R Square | Std. Error of the Estimate |
---|---|---|---|---|
2 | 0.999b | 0.997 | 0.997 | 0.0193502 |
表2. 模型摘要表
表3是回归方程的显著性检验,由检验的P值小于0.05可知回归方程线性显著。
Model | Sum of Squares | df | Mean Square | F | Sig. |
---|---|---|---|---|---|
Regression | 2.249 | 2 | 1.125 | 3003.511 | 0.000b |
Residual | 0.006 | 17 | 0.000 | ||
Total | 2.256 | 19 |
表3. 方差分析表
表4是SPSS软件根据建立的回归模型输出的我国能源消费总量各个年份的预测值、实际值以及两者相对误差的绝对值。
ARMA模型(自回归移动平均模型)的基本思想为一个变量现在的取值,不仅会受到它本身过去值的影响,也会受到现在和过去各种随机因素的影响。
年份 | 实际值 | 拟合值 | 相对误差绝对值(%) |
---|---|---|---|
1999 | 0.0000 | ||
2000 | 0.0198 | 0.01231 | 37.83 |
2001 | 0.0463 | 0.05489 | 18.55 |
2002 | 0.0897 | 0.10948 | 22.05 |
2003 | 0.1747 | 0.20247 | 15.90 |
2004 | 0.2774 | 0.30171 | 8.76 |
2005 | 0.3735 | 0.37261 | 0.24 |
2006 | 0.4511 | 0.43813 | 2.88 |
2007 | 0.5283 | 0.49679 | 5.96 |
2008 | 0.5567 | 0.56301 | 1.13 |
2009 | 0.6046 | 0.59703 | 1.25 |
2010 | 0.6805 | 0.70025 | 2.90 |
2011 | 0.7621 | 0.77657 | 1.90 |
2012 | 0.8087 | 0.81702 | 1.03 |
2013 | 0.8544 | 0.84275 | 1.36 |
2014 | 0.8819 | 0.87071 | 1.27 |
2015 | 0.8946 | 0.87202 | 2.52 |
2016 | 0.9129 | 0.90632 | 0.72 |
2017 | 0.9536 | 0.97361 | 2.10 |
2018 | 1.0000 | 0.99962 | 0.04 |
表4. 模型拟合值及相对误差绝对值表
该模型表示为:
X t − φ 1 X t − 1 − ⋯ − φ p X t − p = ε t − θ 1 ε t − 1 − ⋯ − θ q ε t − q
其中 φ j ( 1 ≤ j ≥ p ) 和 θ j ( 1 ≤ j ≥ q ) 为实数, ε t 为白噪声过程, ε t ~ W N ( 0 , σ 2 ) 。
原始序列经过二阶差分处理后的输出结果见表5。
t-Statistic | Prob.* | ||
---|---|---|---|
Augmented Dickey-Fuller test statistic | −4.196718 | 0.0079 | |
Test critical values: | 1% level | −4.057910 | |
5% level | −3.119910 | ||
10% level | −2.701103 |
表5. 差分处理后单位根检验
由表5我们可以看到此时的P值小于0.05,拒绝原假设,表明该序列是二阶差分平稳序列,即二阶单整。
由图3可以发现样本ACF图拖尾,样本PACF拖尾,可以初步判断是ARMA模型。
图3. 样本PAF和样本ACF图
分别对ARMA (1,1)、ARMA (1,2)、ARMA (2,1)、ARMA (2,2)模型进行回归,记下模型中各最大滞后变量对应的t统计量值,模型的AIC、SC、HQ值等信息。如表6所示。
AIC | SC | HQ | |
---|---|---|---|
ARMA (1,1) | −4.6801 | −4.5309 | −4.6548 |
ARMA (1,2) | −5.1841 | −4.9853 | −5.1505 |
ARMA (2,1) | −4.8346 | −4.6367 | −4.8073 |
ARMA (2,2) | −5.1942 | −4.9469 | −5.1601 |
表6. 四个模型的统计量的值
表7是残差序列相关LM检验选取滞后1阶进行残差相关检验,LM检验统计量obs*R-squared对应的P值0.523,在5%的显著性水平下,不拒绝原假设,检验结果表明残差无序列相关。表明变量无遗落变量,即滞后阶数的选取是合理的。
F-statistic | 1.845363 | Prob.F (1,14) | 0.1958 |
---|---|---|---|
Obs*R-squared | 2.049095 | Prob.Chi-Square (1) | 0.1523 |
表7. 序列相关LM检验表
由表ARCH (1,2)可以得到模型的回归方程为:
CONS t = 2.1826 ∗ ( 1 − 0.9626 ) + 0.9626 CONS t − 1 + v ^ t + 1.4666 v ^ t − 1 + 0.9880 v ^ t − 2
采用静态预测的方法得到的预测图,见图4。
图4. 预测图
将实际值与运用ARCH模型预测得到的拟合值分别放到同一张表,并计算对应的相对误差绝对值,如表8所示。
年份 | 实际值 | 拟合值 | 相对误差绝对值(%) |
---|---|---|---|
1999 | 0.0000 | ||
2000 | 0.0198 | 0.022310 | 12.68 |
2001 | 0.0463 | 0.068394 | 47.72 |
2002 | 0.0897 | 0.091317 | 1.80 |
2003 | 0.1747 | 0.143760 | 17.71 |
2004 | 0.2774 | 0.293648 | 5.86 |
2005 | 0.3735 | 0.355373 | 4.85 |
2006 | 0.4511 | 0.451661 | 0.12 |
2007 | 0.5283 | 0.532931 | 0.88 |
2008 | 0.5567 | 0.582855 | 4.70 |
2009 | 0.6046 | 0.574499 | 4.98 |
2010 | 0.6805 | 0.681967 | 0.22 |
2011 | 0.7621 | 0.764184 | 0.27 |
2012 | 0.8087 | 0.810579 | 0.23 |
2013 | 0.8544 | 0.855310 | 0.11 |
2014 | 0.8819 | 0.900952 | 2.16 |
2015 | 0.8946 | 0.901746 | 0.80 |
2016 | 0.9129 | 0.913439 | 0.06 |
2017 | 0.9536 | 0.952446 | 0.12 |
2018 | 1.0000 | 1.000750 | 0.08 |
表8. 相对误差绝对值
图5. 模型拟合效果对比图
由上图5可以看出,通过绘制折线图发现逐步回归的方法和ARCH模型两种方法预测出的结果与实际值能较好地契合,说明这两种方法在拟合我国能源消费总量时的效果比较好。
计算两种模型的预测结果与实际结果的相对误差绝对值。
见表9,通过计算两种方法的预测结果与实际结果的相对误差绝对值,由上表可以看到ARCH模型计算的相对误差绝对值的平均数要比多元线性回归模型的稍小一些,然而多元线性回归模型的标准差相对要小一些,说明我们在对能源消费总量进行预测时可以结合这两种方法的优缺点,在探索多变量影响因素方面,可以考虑多元线性回归模型,而在单一变量进行预测时采用ARCH模型。
平均数 | 标准差 | |
---|---|---|
多元线性回归模型 | 0.067578209 | 0.099939741 |
ARCH模型 | 0.05544182 | 0.112589011 |
表9. 两种方法的对比表
1、我国的能源消费总量近20年是逐年递增的,随着科技的不断发展,水电、核电、风电这些清洁能源所占比重逐渐增大。
2、煤炭在我国主要能源品种消费中占有的比重过大,石油所占的比重相对较大。
3、我国能源消费总量的增速相比20年前已经明显减缓,说明我国在控制能源消费方面有了显著的成效。
4、城镇化率和第三产业所占比重对我国的能源消费总量影响显著,其中城镇化率对能源消费总量起到正向的作用,第三产业所占比重对能源消费总量起到负向的作用。
5、在预测我国能源消费总量时,ARCH模型和逐步回归方法的拟合效果都比较好,对于多变量预测可以采用逐步回归的方法,对于单变量预测可以选用ARCH模型。
1、推动产业结构优化升级,大力发展高新技术产业,可以通过对高新技术及新兴产业发展实行财政补贴和税收优惠。
2、通过技术创新,提高能源使用效率。政府应当加大对高科技人才的培养与引进,加强企业对新兴技术的使用,此外,我国应当促进与在能源行业有优势的国家的交流与合作。
3、我国应当控制不可再生能源的使用,可以对煤炭价格进行合理的调整,限制煤炭资源的开采,鼓励使用清洁能源。
4、地球上存在着很多可再生能源,应当鼓励政府科技创新,通过风力发电,改善生态环境,缓解全球变暖。
本文受到北方工业大学学生科技活动项目资助,项目编号:11005130019XN140/006。
李 悦,崔玉杰. 中国能源消费总量的预测及影响因素分析 Prediction of Total Energy Consumption in China and Analysis of Its Influencing Factors[J]. 低碳经济, 2020, 09(01): 1-9. https://doi.org/10.12677/JLCE.2020.91001