应用马尔科夫链模型预测短期房价——以南宁市为例
Application of Markov Chain Model to Predict Short-Term Housing Prices—A Case Study of Nanning City
DOI:10.12677/sa.2024.134157,PDF,HTML,XML,下载: 6浏览: 76科研立项经费支持
作者:谭元元,涂火年*:广西财经学院中国–东盟统计学院,广西 南宁
关键词:马尔科夫链状态转移转移概率Markov ChainState TransitionTransition Probability
摘要:本文阐述了马尔科夫预测模型的特点,并通过选取南宁市2019年3月至2022年2月商品房住宅价格的月度统计数据,构建马尔科夫预测模型,借助EViews软件对该数据进行分析,最终得出的预测结果显示,未来一段时间内,南宁市房价处于平稳状态的可能性最大。研究结果和实际情况相符,说明了利用马尔科夫预测模型对房价短期走势的预测是比较精准可靠的。
Abstract:This paper describes the characteristics of the Markov prediction model and constructs the Markov prediction model by selecting the monthly statistical data of residential commodity house prices in Nanning City from March 2019 to February 2022. By analyzing the data with the help of EViews software, the final prediction result shows that the housing prices in Nanning City are most likely to be in a stable state in the future. The results of the study are consistent with the actual situation, which shows that the Markov prediction model is more accurate and reliable in predicting the short-term trend of housing prices.
文章引用:谭元元, 涂火年. 应用马尔科夫链模型预测短期房价——以南宁市为例[J]. 统计学与应用, 2024, 13(4): 1592-1600. https://doi.org/10.12677/sa.2024.134157

1. 引言

如今住房需求已经成为现代人们生活的刚需,买房被不少人列为人生大事之一,而其中人们最在意的因素便是房价,房价是当今社会经济发展过程中普遍受到关注的热点问题之一,它的一涨一落都牵动着每一个居民的心。因此,房价不仅是国泰民安的关键要素之一,也是影响经济发展、社会稳定的重要因素。但近年来房价持续不断地上涨,严重影响到实体经济,实体经济日趋低迷,同时也加重了普通居民的生活负担,普通居民的幸福感下降,进而容易造成负面的社会影响和效应;另一方面,房价的上涨会使炒房客更加猖狂,影响并干扰到房地产市场的正常运转。

为稳定房价,保证房地产市场正常健康的运转,我国政府出台了相关的调控政策。自2010年起,我国政府不断加大房价调控力度,以期通过调控手段来影响房价,稳定房地产市场。通过政府的这些调控政策,多年来,房价调控均有一定的成效,房价的过快上涨势头得到了一定程度的遏制,但同时也出现了房价越调控越涨的情况,让政府的调控政策对房地产市场产生较多的无效作用。总之,受政府调控政策和房地产市场的复杂实际情况等众多因素的共同影响,未来房价走势仍然存在很大的不确定性,这在一定程度上给政府、开发商、消费者特别是需要贷款买房的刚需用户的决策带来很大的困扰。

因此,建立对未来一段时间的房价做出准确有效预测的合理有效的模型并进行合理的分析就具有非常重要的现实意义。

已有较多学者和专家从不同的角度运用多种不同的方法在学术领域对未来房价进行了分析和预测。例如刘晓君等在《基于VAR-GM(1, 1)-SVR模型的房地产价格预测研究》一文中[1],以网络搜索数据为基础,并利用向量自回归模型VAR和GM(1, 1)模型分别预测房地产价格;然后构建基于向量自回归模型VAR和GM(1, 1)的VAR-GM(1, 1)-SVR模型将以上两个模型的预测结果进行预测融合,并以西安市数据为例进行验证,并且得到了优于单一模型的预测效果;孟盈竹等在《基于ARIMA时间序列模型的房地产价格预测——以沈阳市为例》一文中[2]对沈阳市2010~2019年房地产价格的数据进行了分析,显然2010~2019年房地产价格的数据是一时间序列,该文利用时间序列有关知识和理论对2010~2019年房地产价格的数据建立ARIMA时间序列模型,并通过建立的模型来预测沈阳市未来房地产价格。这些方法大多对历史数据要求较高,同时又需要满足所使用方法的条件,这样就会导致数据统计的难度不仅加大,而且在实际操作中也不易进行。

马尔科夫模型作为一种较新的预测模型在很多方面得到了应用和研究,国内多位学者和专家应用马尔科夫模型进行了各种研究与预测,并都取得了一定的研究成效。例如陈爽等运用马尔科夫链及其相关模型对股价进行了研究分析[3],他们的研究分别对具有马尔科夫性的股票价格用马尔科夫链有关模型来对股票价格涨跌的概率进行预测和对划分的股票价格所处状态区间的概率进行分析和预测,该研究充分阐述了马尔科夫链有关模型在股价预测研究中的运用;学者刘鲁文等在《基于马尔科夫链的教学效果评估方法》一文中[4]讨论研究了马尔科夫链模型在教学效果评估中的应用,该方法评估结果直观、客观,是一种较理想和科学的评估方法。马尔科夫链模型在房价方面的研究也具有一定的成效:学者李秀芝等在《马尔科夫链在宜宾市房价预测中的应用》一文中[5]选取宜宾市2016年1月至2020年4月商品房销售价格的月度统计数据,结合马尔科夫链有关知识理论对选取的数据构建马尔科夫预测模型,并通过构建的预测模型预测未来一段时间内宜宾市的房价走势。

本文借鉴有关马尔科夫模型现有的研究成果,首先对马尔科夫预测模型进行了较深入的分析和讨论,进一步对该方法进行了整理和巩固,然后把马尔科夫预测模型应用于南宁市房价的研究上,并对南宁市房价进行了分析和预测,为南宁市相关部门制定有关调控房价决策和有关人员进行商品房住宅购买或投资提供理论参考。

2. 马尔科夫预测模型介绍

2.1. 理论基础

马尔科夫链[6]是以俄国数学家安德雷·安德耶维齐·马尔科夫命名的一种预测模型。在事物的发展过程中,若每次状态的转移都只与前一时刻的状态有关,而与过去的状态无关,或者说状态转移过程是“无后效性”,即要确定过程将来的状态,知道它此刻的情况就足够了,并不需要对它以往状况的认识,这样的状态转移过程称为马尔科夫过程。该过程用数学语言描述就是:如果随机过程 { X t , t T } ,具有如下特殊性质: X t = i 表过程在时刻t处于状态i,则在下一时刻 t + 1 将处于状态j的概率满足:

P ( X t + 1 = j | X 0 = i 0 , X 1 = i 1 , , X t 1 = i t 1 , X t = i ) = P ( X t + 1 = j | X t = i )

对于 t = 0,1, 和每一个状态序列 i , j , i 0 , i 1 , , i t 1 均成立,该随机过程被称为具有马尔科夫属性,具有马尔科夫属性的随机过程被称为马尔科夫链。

条件概率 P ( X t + 1 = j | X t = i ) = p i j 为马尔科夫链的一步转移概率,简称转移概率;类似地,称条件概率 P ( X t + n = j | X t = i ) = p i j ( n ) n步转移概率[7]

马尔科夫预测模型是基于马尔科夫链的有关理论知识计算出未来各时刻各状态下的概率,然后预测所研究的过程未来所处的状态即为概率最大时的状态,这是一种利用概率建立随机序列模型进行预测的方法,是一种预测事件发生概率的方法。

2.2. 马尔科夫预测模型的建立

2.2.1. 模型适用条件

1) 具有马尔科夫属性的随机过程,即过程具有“无后效性”;

2) 随机过程在要预测的时期内,各时刻的状态转移概率保持稳定,即每一时刻向下一时刻变化的转移概率都是一样的,均为一步转移概率;

3) 随机过程平稳。

2.2.2. 预测模型

1) 任意时刻状态概率预测

假定马尔科夫链有n个可能的状态 E 1 , E 2 , , E n ,则:

P = ( p i j ) = ( p 11 p 12 p 1 n p 21 p 22 p 2 n p n 1 p n 2 p n n )

为状态转移概率矩阵,一般简称转移矩阵,相应地,称 P ( n ) = ( p i j ( n ) ) n步转移矩阵。

查普曼–柯尔莫哥洛夫(Chapmann-Kolmogorov)方程,简称C-K方程:

设随机过程 { X t , t T } 是时齐马尔科夫链,对一切 n , m 0 i , j S S表过程的状态空间,有:

p i j ( m + n ) = k S p i k ( m ) p k j ( n )

P ( n ) = P P ( n 1 ) = P P P ( n 2 ) = = P n

通过上述C-K方程的两个结论,很容易得到马尔科夫链中任意时刻状态概率预测。设 π i ( k ) 表示事件在初始状态为已知的条件下,经过k次状态转移后,在第k个时刻处于状态 E i 的概率。从初始状态开始,经过k次状态转移后到达状态 E i 这一状态转移过程,根据C-K方程,可以看作是首先经过k− 1次状态转移后达到状态,后再由 E j ( j = 1 , 2 , , n ) 经过一次状态转移到达状态 E i ,则:

π i ( k ) = j = 1 n π j ( k 1 ) p j i , ( i = 1 , 2 , , n ) (1)

π ( 0 ) = ( π 1 ( 0 ) , π 2 ( 0 ) , , π n ( 0 ) ) 为初始状态概率向量,k时刻的状态概率为 π ( k ) ,同样由C-K方程,则预测k时刻的状态概率为:

π ( k ) = π ( k 1 ) P = π ( 0 ) P k (2)

2) 终极状态概率预测

经过无穷多次状态转移后随机过程所处状态的概率称为随机过程的终极状态概率[8]。记终极状态概率向量为 π = ( π 1 , π 2 , , π n ) ( 0 π i 1 , i = 1 , 2 , , n ) ,终极状态概率同时满足以下条件[5]

π = π P i = 1 n π i = 1

很明显,通过这两个条件建立数学方程组,该数学方程组的解便是所讨论的各个终极状态概率。

上述两种概率的预测就是马尔科夫预测模型的主要内容,随机过程的初始分布和转移概率或转移概率矩阵是确定因素。

马尔科夫预测模型是一种预测事件发生概率的方法,但这种预测模型只适合用于具有马尔科夫属性的时间序列,并且时间序列在要预测的时期内,各时刻的状态转移概率保持稳定,即每一时刻向下一时刻变化的转移概率都是一样,均是一步转移概率。若时间序列的状态转移随不同时刻在变化,不适宜用该方法。由于实际的客观事物很难长时间保持同一状态的转移概率,因此这种方法一般适用于短期预测。

综合以上对马尔科夫模型特点的分析,可以选择它来对房价短期走势做预测。

3. 马尔科夫预测模型在南宁市房价走势预测的应用分析

3.1. 数据来源

本文数据来源于网站安居客,选取南宁市2019年3月至2022年2月商品房住宅价格月度数据(如下表1所示)作为研究数据。

Table 1.Residential commodity house prices in Nanning City from March 2019 to February 2022 (Unit: 10,000 yuan)

1.2019年3月至2022年2月南宁市商品房住宅价格(单位:万元)

年份

1月

2月

3月

4月

5月

6月

7月

8月

9月

10月

11月

12月

2019

1.08

1.09

1.09

1.1

1.09

1.1

1.1

1.1

1.1

1.1

2020

1.1

1.1

1.11

1.1

1.1

1.1

1.1

1.11

1.1

1.1

1.1

1.1

2021

1.12

1.15

1.16

1.15

1.14

1.15

1.16

1.15

1.14

1.12

1.11

1.1

2022

1.1

1.1

3.2. 数据平稳性分析

借助EViews软件,首先绘制2019年3月至2022年2月南宁市商品房住宅价格数据的时序图,如图1所示。

Figure 1.Time series chart of residential commodity housing prices in Nanning City from March 2019 to February 2022

1.2019年3月至2022年2月南宁市商品房住宅价格时序图

图1可以看到,2019年3月至2022年2月南宁市商品房住宅价格存在明显的趋势,这是不平稳时间序列的特征,因此可以根据时序图初步判断该序列是不平稳时间序列,接着对该序列进行滞后阶数是6阶的ADF检验,检验结果如图2所示。

Figure 2.ADF test results of residential commodity housing prices in Nanning City from March 2019 to February 2022

2.2019年3月至2022年2月南宁市商品房住宅价格ADF检验结果

图2可以看到,检验T统计量的值是−1.855207,该值分别大于显著性水平是1%、5%、10%对应的临界值,按照ADF检验的判别规则是不能拒绝原假设的;另一方面,检验的P值是0.6553,大于0.05,根据P值法的判别规则,做出的决策也是不能拒绝原假设,而ADF检验的原假设是序列不平稳,因此由ADF检验的结果可进一步确认南宁市商品房住宅价格序列是不平稳的序列。

采用马尔科夫预测模型分析时,首先要确保时间序列是平稳的,对于不平稳的时间序列可以通过差分运算来对序列平稳化。此处的2019年3月至2022年2月南宁市商品房住宅价格数据由上述分析可知是不平稳的,在进行差分处理时按照统计建模的“约简”原则。由低阶开始进行,如果低阶差分满足要求就不需要进行高阶差分,对该序列进行一阶差分后的ADF检验结果如图3所示。

Figure 3.ADF test results of first-order difference of residential commodity housing prices in Nanning City from March 2019 to February 2022

3.2019年3月至2022年2月南宁市商品房住宅价格一阶差分ADF检验结果

图3可以看到,2019年3月至2022年2月南宁市商品房住宅价格一阶差分后ADF检验的T统计量值是−4.263012,分别小于显著性水平是1%、5%、10%对应的临界值,按照ADF检验的判别规则是要拒绝原假设的;另一方面,检验的P值是0.0098,小于0.05,根据P值法的判别规则,做出的决策也是拒绝原假设,这说明南宁市商品房住宅价格一阶差分后的序列是平稳的。因此,将一阶差分后的数据也就是数据的变化作为马尔科夫的状态。

3.3. 基于马尔科夫预测模型对南宁市房价的预测

3.3.1. 状态划分

在划分预测对象状态时,如果预测对象本身有明显的状态界限,则以其界限划分;相反,则根据实际情况人为划分。本文根据实际情况,将南宁市商品房价格月度变化分为3个状态:上升、稳定和下降,分别记为E1E2E3。依照表1利用公式(3)计算出月距环比指数,也就是每月房价的环比增长速度:

= × 100 % (3)

计算结果如下表2所示。

Table 2.Average monthly ring index of residential commodity housing prices in Nanning City from March 2019 to February 2022 (Unit: %)

2.2019年3月至2022年2月南宁市商品住宅价格月均环比指数(单位:%)

年份

1月

2月

3月

4月

5月

6月

7月

8月

9月

10月

11月

12月

2019

0.93

0

0.92

−0.91

0.92

0

0

0

0

2020

0

0

0.91

−0.90

0

0

0

0.91

−0.90

0

0

0

2021

1.82

2.68

0.87

−0.86

−0.87

0.88

0.87

−0.86

−0.87

−1.75

−0.89

−0.90

2022

0

0

每月房价的环比增长速度大于0的作为上升状态E1,波动在0.1%范围内视为稳定状态E2,每月房价的环比增长速度小于0的作为下降状态E3。按照这个状态划分原则,2019年3月至2022年2月各月份的状态如表3所示。

Table 3.Transition of residential commodity house price change state in Nanning City from March 2019 to February 2022

3.2019年3月至2022年2月南宁市商品住宅价格变化状态转移情况

年份

1月

2月

3月

4月

5月

6月

7月

8月

9月

10月

11月

12月

2019

E1

E2

E1

E3

E1

E2

E2

E2

E2

2020

E2

E2

E1

E3

E2

E2

E2

E1

E3

E2

E2

E2

2021

E1

E1

E1

E3

E3

E1

E1

E3

E3

E3

E3

E3

2022

E2

E2

3.3.2. 短期房价状态概率预测

表3数据可知,初始状态是E1的样本有10组,其中下一个状态是E1的样本有3组,是E2的样本有2组,是E3的样本有5组,由统计思想,现实世界中事件发生的概率由对应事件发生的频率来估计,得到初始状态是E1分别转移到E1E2E3状态的一步转移概率估计值分别是: p 11 = P ( E 1 | E 1 ) = 0 .3 p 12 = P ( E 2 | E 1 ) = 0 .2 p 13 = P ( E 3 | E 1 ) = 0 .5 ;由表3数据又看到2022年3月是将来状态,因此2022年2月的下一个状态不能确定,而2月的状态是E2,为了得到较准确、合理的状态E2转移到E1E2E3各状态的一步转移概率的估计,本文在考虑初始状态处于E2的样本数时,把2022年2月的状态剔除考虑,基于这样的分析,初始状态是E2的样本有14组,其中下一个状态是E1的样本有4组,是E2的样本有10组,是E3的样本有0组,同样的分析方法和思想,得到初始状态是E2分别转移到E1E2E3状态的一步转移概率分别是 p 2 1 = P ( E 1 | E 2 ) = 0 .29 p 2 2 = P ( E 2 | E 2 ) = 0 .71 p 2 3 = P ( E 3 | E 2 ) = 0 ;初始状态是E3的样本有10组,其中下一个状态是E1的样本有2组,是E2的样本有3个,是E3的样本有5组,得到初始状态是E3分别转移到状态E1E2E3的一步转移概率分别是 p 3 1 = P ( E 1 | E 3 ) = 0 .2 p 3 2 = P ( E 2 | E 3 ) = 0 .3 p 3 3 = P ( E 3 | E 3 ) = 0 .5 。综上分析,得到南宁市商品住宅价格月度变化的一步状态转移矩阵,如下式所示:

P = ( p 11 p 12 p 13 p 21 p 22 p 23 p 31 p 32 p 33 ) = ( 0.3 0.2 0.5 0.29 0.71 0 0.2 0.3 0.5 ) (4)

表3看到,2022年2月份房价和上个月是持平的,属于平稳状态,因此将2022年2月份的房价状态看成初始状态,记为 π 0 = ( 0 , 1 , 0 ) ,根据公式(1)和南宁市商品住宅价格月度变化的一步状态转移矩阵(4)式,得到2022年3月马尔夫预测模型、3月份南宁市商品房住宅价格状态概率:

3月份房价处于上升状态E1,用 i = 1 表示,对应概率为:

π 1 ( 1 ) = j = 1 3 π i ( 0 ) p i 1 = π 1 ( 0 ) p 11 + π 2 ( 0 ) p 21 + π 3 ( 0 ) p 31 = p 21 = 0.29

3月份房价处于稳定状态E2,用 i = 2 表示,对应概率为:

π 2 ( 1 ) = j = 1 3 π i ( 0 ) p i 2 = π 1 ( 0 ) p 12 + π 2 ( 0 ) p 22 + π 3 ( 0 ) p 32 = p 22 = 0.71

3月份房价处于下降状态E3,用 i = 3 表示,对应概率为:

π 3 ( 1 ) = j = 1 3 π i ( 0 ) p i 3 = π 1 ( 0 ) p 13 + π 2 ( 0 ) p 23 + π 3 ( 0 ) p 33 = p 23 = 0

继续使用马尔夫预测模型公式(1)可以得到2022年4月份、5月份、6月份、7月份、8月份南宁市商品房住宅价格变化状态概率预测值,预测结果汇总如下表4所示。

Table 4.Predictive value of the probability of the change state in residential commodity housing prices in Nanning City from March to August 2022

4.南宁市2022年3月至8月商品房住宅价格变化状态概率预测值

时间

E1状态概率

E2状态概率

E3状态概率

2022年3月

0.29

0.71

0

2022年4月

0.2929

0.5621

0.145

2022年5月

0.2799

0.5011

0.2190

2022年6月

0.2731

0.4775

0.2494

2022年7月

0.2703

0.4685

0.2613

2022年8月

0.2692

0.4650

0.2658

表4可以看到,2022年南宁市未来3月份到8月份这半年的时间里,从6月份开始每月房价处于上升状态的概率和处于下降状态的概率相差不大,但在这未来的半年时间里,商品房住宅价格处于稳定的状态始终都大于分别处于上升和下降状态的概率,这说明南宁市2022年自3月份起未来半年的商品房住宅价格处于稳定状态的可能性最大。

3.3.3. 南宁市商品房住宅价格终极状态概率预测

设南宁市商品房住宅价格终极状态的概率为 π = ( π 1 , π 2 , π 3 ) π 1 , π 2 , π 3 分别表示处于上升、平稳、下降状态的概率。由马尔科夫预测模型公式(2)和南宁市商品住宅价格月度变化的一步状态转移矩阵(4)式,有:

( π 1 , π 2 , π 3 ) = ( π 1 , π 2 , π 3 ) ( 0.3 0.2 0.5 0.29 0.71 0 0.2 0.3 0.5 )

整理后得方程组:

{ π 1 = 0.3 π 1 + 0.29 π 2 + 0.2 π 3 π 2 = 0.2 π 1 + 0.71 π 2 + 0.3 π 3 π 3 = 0.5 π 1 + 0.5 π 3 π 1 + π 2 + π 3 = 1

求解上述方程组得: π 1 = π 3 = 0.2685 π 2 = 0.463

由上述方程组的结果可得到南宁市商品房住宅价格变化终极状态的概率情况是:平稳状态概率大于上升状态概率和下降状态概率,上升状态概率和下降状态概率相等。这说明南宁市房价的变化过程在经过无穷次状态转移之后,平稳状态出现的概率大于上升状态和下降状态的概率,上升状态的概率和下降状态的概率相等。结合现实情况,南宁市商品房住宅价格在2019年之前的时间里每月房价大多数都处于上升状态,而且上升的势头很明显,进入2020年后,房价上升的势头有所削弱,由表1南宁市2019年3月至2022年2月商品房住宅价格表可以看到,这三年的每月房价总体上变化的幅度很小,可以认为这三年的房价变化平稳。很明显,本文使用马尔科夫预测模型讨论南宁市商品房住宅价格状态变化和现实情况总体相符。

另外,通过查看安居网南宁市2022年3月至8月的真实房价如下表5所示。

Table 5.Residential commodity housing prices in Nanning City from March to August 2022 (Unit: yuan)

5.2022年3月至8月南宁市商品房住宅价格(单位:元)

3月

4月

5月

6月

7月

8月

11,133

11,130

11,026

11,026

11,065

11,077

表5可以看到,南宁市3月至8月的真实房价在11,000元上下波动,房价变化稳定。很明显,本文使用马尔科夫预测模型讨论南宁市商品房住宅价格状态变化和现实情况总体相符。

4. 结论

本文利用马尔科夫预测模型对南宁市商品房住宅价格变化进行研究预测,研究结果显示:自2022年3月份起至未来的半年时间里,南宁市商品房住宅价格处于平稳状态的可能性比上升或下降状态的可能性大。也就是说,南宁市3月份至8月份的房价处于平稳状态,房价没有明显的下降或上涨。

预测结果和实际情况相符,从而说明了利用马尔科夫预测模型对房价短期走势的预测是比较精准可靠的。

基金项目

2023年校级示范思政课题——时间序列分析。

NOTES

*通讯作者。

参考文献

[1] 刘晓君, 胡升凯, 迟依涵. 基于VAR-GM(1, 1)-SVR模型的房地产价格预测研究[J]. 数学的实践与认识, 2021, 51(1): 1-12.
[2] 孟盈竹, 孙胜男. 基于ARIMA时间序列模型的房地产价格预测——以沈阳市为例[J]. 内江科技, 2021, 42(5): 65, 74.
[3] 陈爽, 李丹, 高洪韵. 马尔科夫链及其在股票价格预测中的应用[J]. 现代经济信息, 2017(24): 288.
[4] 刘鲁文, 陈兴荣, 何涛. 基于马尔科夫链的教学效果评估方法[J]. 统计与决策, 2014(3): 93-94.
[5] 李秀芝, 刘成林, 刘琴, 等. 马尔科夫链在宜宾市房价预测中的应用[J]. 宜宾学院学报, 2020, 20(4): 70-73.
[6] 胡振寰, 王智文, 唐博文. 基于马尔科夫链的柳州市房价预测研究[J]. 广西科技大学学报, 2018, 29(4): 79-83.
[7] 张波, 张景肖, 肖宇谷. 应用随机过程[M]. 第2版. 北京: 清华大学出版社, 2019.
[8] 谷秀娟, 李超. 基于马尔科夫链的房价预测研究[J]. 消费经济, 2012, 28(5): 40-42.

为你推荐



Baidu
map