两个空间变量空间相关性的分析
Exploration on Spatial Correlation of Two Space Variables
摘要:本文研究了两个空间变量空间相关性的问题,定义了一个测度两个空间变量空间相关性的系数。通过Monte Carlo模拟发现,当两个空间变量存在线性关系时,这个新的系数测度了两个空间变量空间结构的相似性。
Abstract:This paper studies the spatial correlation of two space variables and defines the spatial correlation coefficient of them. By using Monte Carlo random simulation method, it is obtained that when there is a linear relationship between the two space variables, the new coefficient measures the space structure similarity of them.
文章引用:常琼玉, 窦剑军. 两个空间变量空间相关性的分析[J]. 统计学与应用, 2016, 5(4): 397-403. http://dx.doi.org/10.12677/SA.2016.54043

1. 引言

两个空间变量的空间相关关系一直是空间统计学的热门研究课题。特别是在空间计量经济学和气候研究中,例如,经济增长和能源消费之间的关系,经济增长与污染物排放之间的关系,一个地区降雨量与气温之间的关系。

有关空间变量的空间相关性分析,国内外学者都是通过Moran’s I检验出空间的自相关性,然后建立空间计量模型,通过估计的模型的参数检验空间的依赖性。Badi H. Baltagi、Seuck Heun Song、Byoung Cheol Jung和Won Koh (2003) [1] 建立了面板数据回归模型,检验了序列的相关性,空间自回归和随机效应;Pesaran、Mohammad Hashem (2004) [2] 建立了面板数据回归模型诊断检验横截面数据的依赖性;张晓旭和冯宗宪(2008) [3] 建立了空间误差自回归模型和广义空间模型分析中国人均GDP的空间相关与地区收敛,得出正的空间自相关以及空间异质性的存在,而且空间上的相互作用和地理位置对于人均收入增长的作用随时间不断加强;Qian Li、Jinping Song、Enru Wang、Hao Hu、Jianhui Zhang、Yeyao Wang (2014) [4] 基于中国县一级的数据研究了经济增长与污染物排放的关系,得出中国近几年工业化的进程以及重工业的转移。

但是这些研究都是基于空间具体的模型上对两个空间变量进行回归分析,建立回归方程然后在进行假设检验的统计推断。然而到目前能够刻画两个空间变量空间相关关系的定义还没有,鉴于此本文定义了一个与经典统计学测度两个随机变量相关性的Pearson相关系数类同的统计量,测度两个空间变量的空间相关关系,命名为新相关系数。用这个新定义相关系数来测度两个空间变量的空间关系,通过模拟和实证分析来探讨这个新的定义究竟刻画了两个空间变量怎样的空间关系。全文安排如下,第二部分研究新相关系数的定义和它的一些性质,第三部分通过Monte Carlo模拟得到两个具有空间自相关的空间变量之间的相关程度,第四部分为实证分析,第五部分为结论和进一步的讨论。

2. 新相关系数及其性质

Pearson’s相关系数是测度两个随机变量之间相关性的统计量,它的定义为

类似的定义两个空间变量的相关系数为

其中W为空间权重矩阵。新相关系数的估计值为

这里表示的空间滞后,表示的空间滞后,其推导过程如下:

为空间变量的一个样本,为空间变量的一个样本

所以新相关系数分子的估计值为

分母的估计值为

可以证明满足不等式,应用Cauchy-Schwarz不等式,可以重写空间变量X,Y满足:

等号成立当且仅当一个空间变量是另一个空间变量的倍数,这就是

至少有一个不为0。

可以重写不等式(2.6)为

因为严格为正。

3. Monte Carlo模拟

考虑如下三种数据生成情况,在模拟过程中空间权重矩阵为Rook规则型权重矩阵,观察的样本量为20 × 20单元格上的400个样本,模拟次数均为50次。

情况1:假设数据生成过程为

这是X与Y相互独立即,当固定不变时之间关系如表1

表1可以看出只有当是,两个空间变量的相关系数为1,当时,两个空间变量的相关系数都趋于0。

情况2:假设数据生成过程为

表2可以看出当时随着的增大,也呈现出有一定规律的增大,当的变化比较特殊,当时,当时,除个别点外基本上趋于−1,当除个别点外基本上趋于1,当两个空间变量的相关系数基本上都大于0并且随的增大而增大,当是,两个空间变量的相关系数恒为1.当时,不论怎样变化趋于−1,当,不论怎样变化趋于1。

情况3:假设数据生成过程为

表3可以看出,当时,它们之间的相关系数恒等于1。当时,随着的增大呈现出一定规律的变化,和第二种情况一样变化比较特殊,时,当趋于1,时趋于−1,当时,呈现出先上升后下降的趋势。

4. 实证分析

这一部分用新定义的相关系数来计算GDP和固定资产投资,GDP和社会消费总额,GDP和进出口额这三对空间变量之间的系数,进一步来确认这个新的定义。使用2013年中国31个省份(不含港澳台地区) GDP,固定资产投资,社会消费总额,进出口额的数据,数据来源2014年中国统计年鉴。

空间权重矩阵是计算两个空间变量相关系数的关键,也是地区间空间影响方式的体现。最常用的是简单二分权重矩阵,遵循的判定规则是Rook相邻规则,即两个地区拥有共同边界则视为相邻。矩阵

Table 1. Relationship between and

表1.之间的关系

Table 2. Relationship between, and

表2.,之间的关系

Table 3. Relationship between, and

表3.,之间的关系

Table 4. China’s 31 provinces, cities and geographical neighbor information

表4. 中国31个省市地理相邻信息

资料来源:《中华人民共和国地图》。

设定方式如下:主对角线上的元素为0,如果地区与地区相邻,则为1,否则为0。经过行标准化处理,用每个元素同时除以所在行元素之和,使得每行元素之和为1,表4列出了中国31个省市地理相邻信息。这种设置方式简单,计算简便,故使用广泛。

计算得出Y(GDP)和固定资产投资()之间的相关系数为:0.876

Y的空间自回归模型为:的空间自回归模型为:

计算得出Y(GDP)和社会消费总额(X2)之间的相关系数为:0.991

的空间自回归模型为:

计算得出Y(GDP)和进出口总额(X3)之间的相关系数为:0.839

的空间自回归模型为:

5. 结论

在上面三种情况下,模拟了两个空间变量的相关系数,出现了一定的规律性,但这种规律比较弱,它们之间的定量关系还得进一步探讨。但是通过实证分析得出,当两个空间变量的空间结构相近且这两个变量之间存在一定的关系时,它们之间新定义的这种相关系数就大,当两个空间变量的空间结构相差比较大时,它们之间新定义的这种相关系数就小,这样当两个空间变量存在一定关系时,这种新的定义刻画的是两个空间变量空间结构的相似性,故把这个新的定义称为两个空间变量空间结构的相似系数。

参考文献

[1] Baltagi, B.H., Song, S.H., Jung, B.C. and Koh, W. (2003) Testing for Correlation, Spatial Autocorrelation and Random Effects Using Panel Data. Journal of Econometrics, 140, 5-51.
https://doi.org/10.1016/j.jeconom.2006.09.001
[2] Pesaran, M.H. and Hashem Pesaran, M. (2004) General Diagnostic Tests for Cross Section Dependence in Panels. CESifo Working Papers, No. 1229.
[3] 张晓旭, 冯宗宪. 中国人均GDP的空间关系与地区收敛: 1987-2003 [J]. 经济学(季刊), 2008(1): 399-414.
[4] Li, Q., Song, J.P., Wang, E.R., Hu, H., Zhang, J.H. and Wang, Y.Y. (2014) Economic Growth and Pollutant Emissions in China: A Spatial Econometric Analysis. Stochastic Environmental Research and Risk Assessment, 28, 429-442.
https://doi.org/10.1007/s00477-013-0762-6

为你推荐



Baidu
map