1. 引言
两个空间变量的空间相关关系一直是空间统计学的热门研究课题。特别是在空间计量经济学和气候研究中,例如,经济增长和能源消费之间的关系,经济增长与污染物排放之间的关系,一个地区降雨量与气温之间的关系。
有关空间变量的空间相关性分析,国内外学者都是通过Moran’s I检验出空间的自相关性,然后建立空间计量模型,通过估计的模型的参数检验空间的依赖性。Badi H. Baltagi、Seuck Heun Song、Byoung Cheol Jung和Won Koh (2003) [1] 建立了面板数据回归模型,检验了序列的相关性,空间自回归和随机效应;Pesaran、Mohammad Hashem (2004) [2] 建立了面板数据回归模型诊断检验横截面数据的依赖性;张晓旭和冯宗宪(2008) [3] 建立了空间误差自回归模型和广义空间模型分析中国人均GDP的空间相关与地区收敛,得出正的空间自相关以及空间异质性的存在,而且空间上的相互作用和地理位置对于人均收入增长的作用随时间不断加强;Qian Li、Jinping Song、Enru Wang、Hao Hu、Jianhui Zhang、Yeyao Wang (2014) [4] 基于中国县一级的数据研究了经济增长与污染物排放的关系,得出中国近几年工业化的进程以及重工业的转移。
但是这些研究都是基于空间具体的模型上对两个空间变量进行回归分析,建立回归方程然后在进行假设检验的统计推断。然而到目前能够刻画两个空间变量空间相关关系的定义还没有,鉴于此本文定义了一个与经典统计学测度两个随机变量相关性的Pearson相关系数类同的统计量,测度两个空间变量的空间相关关系,命名为新相关系数。用这个新定义相关系数来测度两个空间变量的空间关系,通过模拟和实证分析来探讨这个新的定义究竟刻画了两个空间变量怎样的空间关系。全文安排如下,第二部分研究新相关系数的定义和它的一些性质,第三部分通过Monte Carlo模拟得到两个具有空间自相关的空间变量之间的相关程度,第四部分为实证分析,第五部分为结论和进一步的讨论。
2. 新相关系数及其性质
Pearson’s相关系数是测度两个随机变量之间相关性的统计量,它的定义为
类似的定义两个空间变量的相关系数为
其中W为空间权重矩阵。新相关系数的估计值为
这里表示的空间滞后,表示的空间滞后,其推导过程如下:
为空间变量的一个样本,为空间变量的一个样本
所以新相关系数分子的估计值为
分母的估计值为
可以证明满足不等式,应用Cauchy-Schwarz不等式,可以重写空间变量X,Y满足:
等号成立当且仅当一个空间变量是另一个空间变量的倍数,这就是
,,至少有一个不为0。
可以重写不等式(2.6)为
因为与严格为正。
3. Monte Carlo模拟
考虑如下三种数据生成情况,在模拟过程中空间权重矩阵为Rook规则型权重矩阵,观察的样本量为20 × 20单元格上的400个样本,模拟次数均为50次。
情况1:假设数据生成过程为和,
这是X与Y相互独立即和,当固定不变时和之间关系如表1。
从表1可以看出只有当是,两个空间变量的相关系数为1,当时,两个空间变量的相关系数都趋于0。
情况2:假设数据生成过程为
从表2可以看出当时随着的增大,也呈现出有一定规律的增大,当时随的变化比较特殊,当时,当时,除个别点外基本上趋于−1,当除个别点外基本上趋于1,当两个空间变量的相关系数基本上都大于0并且随的增大而增大,当是,两个空间变量的相关系数恒为1.当时,不论怎样变化趋于−1,当,不论怎样变化趋于1。
情况3:假设数据生成过程为
从表3可以看出,当时,它们之间的相关系数恒等于1。当时,是随着的增大呈现出一定规律的变化,和第二种情况一样变化比较特殊,时,当时趋于1,时趋于−1,当时,呈现出先上升后下降的趋势。
4. 实证分析
这一部分用新定义的相关系数来计算GDP和固定资产投资,GDP和社会消费总额,GDP和进出口额这三对空间变量之间的系数,进一步来确认这个新的定义。使用2013年中国31个省份(不含港澳台地区) GDP,固定资产投资,社会消费总额,进出口额的数据,数据来源2014年中国统计年鉴。
空间权重矩阵是计算两个空间变量相关系数的关键,也是地区间空间影响方式的体现。最常用的是简单二分权重矩阵,遵循的判定规则是Rook相邻规则,即两个地区拥有共同边界则视为相邻。矩阵的
Table 1. Relationship between and
表1.与之间的关系
Table 2. Relationship between, and
表2.,与之间的关系
Table 3. Relationship between, and
表3.,与之间的关系
Table 4. China’s 31 provinces, cities and geographical neighbor information
表4. 中国31个省市地理相邻信息
资料来源:《中华人民共和国地图》。
设定方式如下:主对角线上的元素为0,如果地区与地区相邻,则为1,否则为0。经过行标准化处理,用每个元素同时除以所在行元素之和,使得每行元素之和为1,表4列出了中国31个省市地理相邻信息。这种设置方式简单,计算简便,故使用广泛。
计算得出Y(GDP)和固定资产投资()之间的相关系数为:0.876
Y的空间自回归模型为:;的空间自回归模型为:
计算得出Y(GDP)和社会消费总额(X2)之间的相关系数为:0.991
的空间自回归模型为:;
计算得出Y(GDP)和进出口总额(X3)之间的相关系数为:0.839
的空间自回归模型为:。
5. 结论
在上面三种情况下,模拟了两个空间变量的相关系数,出现了一定的规律性,但这种规律比较弱,它们之间的定量关系还得进一步探讨。但是通过实证分析得出,当两个空间变量的空间结构相近且这两个变量之间存在一定的关系时,它们之间新定义的这种相关系数就大,当两个空间变量的空间结构相差比较大时,它们之间新定义的这种相关系数就小,这样当两个空间变量存在一定关系时,这种新的定义刻画的是两个空间变量空间结构的相似性,故把这个新的定义称为两个空间变量空间结构的相似系数。
参考文献