Research on the Number of Domestic Tourists in a Region Based on ARIMA Model—Taking Yunnan Province as an Example
Yunnan has abundant and unique tourism resources. After years of development, Yunnan tourism has become a pillar industry in the national economy. As a major destination in China, the number of domestic tourists in Yunnan has exceeded 1 billion in 2023. Currently, it is in the initial stage of launching the “15th Five Year Plan”. How to scientifically predict the trend of domestic tourists in Yunnan is an important issue. This article studies the quarterly data of domestic tourists in Yunnan Province from 2010 to 2023, uses the ARIMA model in the time series model for fitting, selects the best model in the fitting model ARIMA (2, 1, 3), obtains the fitting function, and predicts the quarterly trend of domestic tourists in Yunnan Province in the next three years, in order to provide relevant suggestions for the government in future economic planning.
Number of Domestic Tourists
云南旅游资源丰富,优良多样的生态环境、神奇美丽的自然风光、多姿多彩的民族风情、源远流长的历史文化、多元包容的宗教信仰和得天独厚的区位优势,为云南旅游产业的发展提供了良好的条件。改革开放以来,历届省委、省政府都高度重视旅游产业发展,依托得天独厚的资源优势,顺应国际旅游发展趋势,实施政府主导型发展战略,经历了起步发展(1978至1988年间主要以单纯的事业型接待服务为主)、产业建设(1989至1995年间从“接待事业型”向“经济产业型”转变)、支柱产业建设(1996至2005年间成为支柱产业)、“二次创业”(2005至2013年间实施优化结构、转型升级、提质增效的“旅游二次创业”)、旅游强省建设(2013年9月到至今)等阶段,实现了旅游产业从无到有、从小到大的历史性飞跃,走出了一条符合自身实际的特色旅游发展路子。当前,云南旅游业经历了高速发展后,正处于一个稳定发展的阶段,所以在未来旅游经济规划上,一个好的风向标将带领云南省国内旅游人数走出一个新的高度。本文就云南省2010年至2023年的季度国内旅游人数进行了分析,拟合合适的模型以估计后三年云南省季度国内旅游人数,从结果中为旅游主管部门制定旅游业发展和“十五五”文旅规划提供部分参考。
在有关国内旅游人数方面的研究中,比较偏少,多数国内学者主要侧重对地区生产总值的研究,并建立模型进行预测研究。按照研究方法可以大致分为计量经济法(回归模型等)、时间序列法(ARIMA模型、移动平均法、ARCH模型、误差修正模型等)、人工智能法(主要包含有神经网络、灰色理论方法等)。
在时间序列的相关预测方法中,刘金娣,卢婷艳
在神经网络方法中,李云晶,廖飞
在回归模型中,彭思嘉
通过上面的文献分析,以及拟使用的2010年~2023年云南省国内旅游人数季度数据,根据选用的数据特征,本文将选用时间序列模型进行数据建模,但是具体采用什么模型则根据各项检验和估计来进行识别,最后对将来3年云南省国内旅游人数进行预测。
如果时间序列{ }满足如下条件:
任意取 ,有 ;
任意取 有
则可以称序列{ }是纯随机序列,简记为 。
白噪声具有的性质如下:
说明白噪声的各项之间没有任何相关关系,若序列{ }为白噪声,则说明序列{ }中没有值得提取的有用的信息,于是我们应该终止该序列的后续分析。
在对时间序列平稳性进行检验时,时间序列非平稳,则可对原序列进行差分提取确定性信息后再建立模型。此时可以对原序列建立 模型,模型中的 为自回归阶数, 为消除非平稳序列需要差分的次数, 为移动平均阶数。具体结构如下:
(1)
式中 ,为平稳可逆自回归移动平均模型的自回归系数多项式; ,为自回归移动平均模型的平滑系数多项式。
时间序列的波动一般分为四类要素:其中T为长期趋势要素、S为季节要素、C为经济周期循环要素、I为以及不规则要素。常用季节调整分解形式有加法模型和乘法模型两种:
简单季节模型:
(1)
乘积季节模型:
(2)
式中, 表示的是趋势循环,这是因为在调整季节因素的时候并不能把长期趋势和循环要素分开。
简单季节模型各种效应信息在提取的时候非常容易,为了将序列中的季节信息提取充分,我们仅仅通过简单的周期步长差分即可完成,同时,通过简单的低阶差分即可将趋势信息提取充分,在提取完季节信息和趋势信息之后,我们所得到的残差序列就是一个平稳序列。其模型结构如下:
(3)
其中:
D为周期步长,d为提取趋势信息用的差分阶数;
{ }为白噪声序列,且 ;
为q阶移动平均系数多项式;
为p阶自回归系数多项式。
当序列存在季节效应并且季节效应本身存在相关性时,可以使用以周期步长为单位的 模型进行提取。又因为短期相关性和季节效应之间存在乘积关系,所以出来的拟合模型为 和 的乘积。乘积模型的表达式如下:
(4)
其中:
为了避免在研究时间序列的过程中出现虚假回归的问题,所以在拟合动态回归模型时,必须先对序列的平稳性进行检验,只有序列平稳才可以拟合时间序列的动态回归关系。
ADF检验适用于 模型的平稳性检验,其原理如下:
对任意 模型
(5)
其特征方程为:
(6)
如果方程所有的特征根都在单位圆内,即
则序列{ }平稳。
如果方程有一个单位根,假设
则序列{ }非平稳,并且自回归系数之和恰好等于1:
所以,检验得到自回归系数和为1时,就可以判定序列非平稳。
对公式(5)等价变换,得到:
整理以上公式得到:
简单记做:
(7)
其中:
所以,若序列{ }平稳,则:
若序列{ }非平稳,则:
所以在AR (p)单位根检验过程中,假设检验可以确定为如下形式:
构造的ADF统计量:
其中, 为参数 的样本标准差。
本文选择的数据为2010年~2023年的云南省国内旅游人数季度数据,数据均来源于云南省文化和旅游厅。从获得的数据来看该数据每年从第一季度到第四季度都有一个增长的趋势,所以初步认为该数据具有明显的季节趋势,适合使用季节模型进行拟合。
时间序列分析要求数据平稳且非白噪声,所以导入数据之后第一步就是检查数据的平稳性。将转化为时间序列后的数据命名为x,绘制时序图(见
由
观察1阶差分后的序列,已经没有明显的趋势,同时发现季节性影响已经不明显。
对序列进行平稳性检验及白噪声检验,平稳性检验ADF统计量的P值为0.01,小于0.05,可以认为差分后的序列是平稳的;
对差分后的序列进行滞后4期的白噪声检验,残差白噪声检验p值分别为0.008255,0.02703,0.02114,0.01941,由于残差白噪声检验p值均小于0.05,由此我们可以得到结论,差分后的序列属于非白噪声,我们可以进行接下来的分析。
对差分后的序列进行acf检验和pacf检验,得到如下图所示(见
根据差分序列的自相关图和偏自相关图中的滞后阶数,可以拟定以下模型(见
模型 |
AIC值 |
1阶白噪声检验P |
2阶白噪声检验P |
模型一: |
1033 |
0.7812 |
0.7418 |
模型二: |
1032.76 |
0.761 |
0.9536 |
模型三: |
1034.75 |
0.7648 |
0.9557 |
模型四: |
1035.54 |
0.8204 |
0.6222 |
模型五: |
1032.46 |
0.5841 |
0.8591 |
五个模型中,残差白噪声检验P值均大于0.05,说明五个模型均能提取序列中的有效信息,但根据AIC值可以发现模型三更优,故 为本文根据数据特征建立的最优云南省国内旅游人数预测模型,其具体形式为:
对于检验结果,首先观察
的残差自相关图(见
此时
模型可以用来预测,未来3年的得到的云南省季度国内旅游人数如下表所示(见
季度 |
2024年 |
2025年 |
2026年 |
I |
25067.08 |
24707.12 |
24045.49 |
II |
22993.67 |
24154.19 |
24416.18 |
III |
25458.09 |
24140.23 |
24170.24 |
IV |
23398.29 |
24470.57 |
24283.38 |
2024年1季度云南省国内旅游人数实际3.0亿人次,在95%置信区间(19593.07,30300.21)内。
本文基于2010年至2023年云南省国内旅游人数数据,建立了模型,根据分析发现,云南省国内旅游人数受季节性影响变化不明显,最后选择了最优模型 对云南省2024年至2026年中每个季度做了预测,预测结果相比刚过去的13年,云南省季度国内旅游人数总体呈现上升趋势且季度具有明显的周期性。
通过数据预测可以了解云南省未来三年国内旅游人数发展走向,通过