本文利用2020年中国31个省级行政区邮政快递业收入及相关经济发展指标数据,借助空间统计分析的方法,分析了我国邮政快递业收入的空间关联性及影响因素。通过空间权重矩阵不同形式的比较,确定了基于地理邻接性的空间权重矩阵在本研究中的合理性;全局Moran指数表明我国各省份邮政快递业收入存在显著的空间聚集性;基于局部Moran散点图分析了离群点广东省和海南省的邮政快递业收入异常成因;LISA集聚图表明我国快递业低值集聚区域(冷点)主要集中在西北部,高值集聚区(热点)主要集中在东部、东南部沿海地区;通过不同局部自相关指数与实际情况的对比分析可知,对我国邮政快递业收入来说局部Moran指数相较其他两种指标分析结果更合理;对各省份邮政快递业收入与人均可支配收入进行了双变量自相关分析。最后结合实际情况,对长三角和珠三角的未来快递业发展给出了相关建议。 This article mainly uses data on the income of the postal express industry and related economic development indicators of the provinces nationwide in 2020, and analyzes the spatial correlation and influence factors of the income of the postal express industry in the country by spatial statistical analysis methods. Compare different defining methods of spatial weights, confirming the rationality of spatial weight matrix based on geographic proximity in this research. Global Moran index indicates that there is a significant spatial correlation in the income of the postal express industry in all the provinces. Based on Moran scatter plot, the abnormal points of postal express industry income in Guangdong Province and Hainan Province and their causes are analyzed. The LISA cluster map shows that the low-value agglomeration areas (cold spots) are mainly concentrated in the northwest, and the high-value agglomeration areas (hot spots) are mainly concentrated in the eastern and southeast coastal areas. The comparison of the analysis results of different indexes and the reality shows that the Moran index is better than the other two indexes for analyzing the spatial correlation of postal express industry income. A bivariate autocorrelation analysis between the postal express industry income and average disposable income in various provinces is carried out. Considering the actual situation, Yangtze River Delta and the Pearl River Delta is compared and relevant suggestions for future development directions are given.
本文利用2020年中国31个省级行政区邮政快递业收入及相关经济发展指标数据,借助空间统计分析的方法,分析了我国邮政快递业收入的空间关联性及影响因素。通过空间权重矩阵不同形式的比较,确定了基于地理邻接性的空间权重矩阵在本研究中的合理性;全局Moran指数表明我国各省份邮政快递业收入存在显著的空间聚集性;基于局部Moran散点图分析了离群点广东省和海南省的邮政快递业收入异常成因;LISA集聚图表明我国快递业低值集聚区域(冷点)主要集中在西北部,高值集聚区(热点)主要集中在东部、东南部沿海地区;通过不同局部自相关指数与实际情况的对比分析可知,对我国邮政快递业收入来说局部Moran指数相较其他两种指标分析结果更合理;对各省份邮政快递业收入与人均可支配收入进行了双变量自相关分析。最后结合实际情况,对长三角和珠三角的未来快递业发展给出了相关建议。
空间权重矩阵,莫兰指数,双变量自相关
Jian Qiao, Jianing Tan
Faculty of Science, China University of Mining and Technology (Beijing), Beijing
Received: Apr. 3rd, 2021; accepted: Apr. 18th, 2021; published: Apr. 30th, 2021
This article mainly uses data on the income of the postal express industry and related economic development indicators of the provinces nationwide in 2020, and analyzes the spatial correlation and influence factors of the income of the postal express industry in the country by spatial statistical analysis methods. Compare different defining methods of spatial weights, confirming the rationality of spatial weight matrix based on geographic proximity in this research. Global Moran index indicates that there is a significant spatial correlation in the income of the postal express industry in all the provinces. Based on Moran scatter plot, the abnormal points of postal express industry income in Guangdong Province and Hainan Province and their causes are analyzed. The LISA cluster map shows that the low-value agglomeration areas (cold spots) are mainly concentrated in the northwest, and the high-value agglomeration areas (hot spots) are mainly concentrated in the eastern and southeast coastal areas. The comparison of the analysis results of different indexes and the reality shows that the Moran index is better than the other two indexes for analyzing the spatial correlation of postal express industry income. A bivariate autocorrelation analysis between the postal express industry income and average disposable income in various provinces is carried out. Considering the actual situation, Yangtze River Delta and the Pearl River Delta is compared and relevant suggestions for future development directions are given.
Keywords:Spatial Weight Matrix, Moran Index, Bivariate Autocorrelation
Copyright © 2021 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
近年来随着电子商务的蓬勃发展,我国快递行业得到了迅猛发展。快递业是现代服务业的重要组成部分,是国民经济的重要产业构成和经济增长点。快递业的发展一方面能够促进流通方式的转型以及消费结构的升级,另一方面也能够降低流通成本、提高流通效率、吸引就业、服务消费者生活等 [
本文以国家邮政局(http://www.spb.gov.cn/)官网公布的2020年中国31个省级行政区(香港,澳门,台湾除外,后文简称为省份)邮政快递业收入为研究对象。其中,排名在前三位的省份为广东、上海、浙江,排名在后三位的省份为西藏、青海、宁夏。31个省份的快递业收入平均值为24.19亿元,中位数为84.30亿元。从整体集聚态势来看,体现为“东高,西低,南高,北低”的特点。
(一) 空间权重矩阵
空间权重矩阵是空间统计分析的基础,用以表达n个样本的空间邻近关系,通常定义为n × n的矩阵
W n × n = ( w i j ) , i = 1 , ⋯ , n , j = 1 , ⋯ , n
其中 w i j 表示样本 i , j 之间的临近关系。空间权重矩阵常见类型有基于地理邻近性、基于空间距离和K近邻三种。
1) 基于地理邻近性的空间权重矩阵
基于地理邻近性的空间权重矩阵中 w i j = { 1 区 域 i 和 j 邻 接 0 否 则 ,常见空间邻接有Queen邻接和Rock邻
接两种类型。Rock邻接仅限区域之间边与边相邻,Queen邻接除区域边与边相邻外,还可以是两区域之间有公共点。经过对我国31个省份的实际分析可知,中国各省的Rock邻接与Queen邻接所得空间权重矩阵是相同的。
2) 基于空间距离的空间权重矩阵
基于空间距离的空间权重矩阵中 w i j = { 1 区 域 i 和 j 距 离 小 于 d 0 否 则 ,当对我国31个省份进行研究时,由
于西藏和新疆面积较大,二者之间的距离相对过大,而二者地理位置的邻近性会使得距离d的选择过大从而造成部分内地省份的邻居数多达十余个,与实际情况严重偏离。因此此种空间权重定义方式对于本例并不合理。当距离d的选择使得西藏和新疆相互邻接且邻居数皆为1时,其他省份的邻居数如表1所示。
邻居数 | 省份 |
---|---|
1~5 | 新疆、西藏、青海、云南、海南、黑龙江 |
6~10 | 甘肃、广西、广东、福建、江西、浙江、辽宁、吉林、内蒙古 |
11~15 | 四川、贵州、江苏、上海、山西、河北、北京、天津、重庆、宁夏 |
16~20 | 湖南、湖北、安徽、陕西、河南、山东 |
表1. 基于距离条件下的各省份近邻数
3) K-近邻空间权重矩阵。
K-近邻空间权重矩阵设定中将在研究区内与样本i距离最近的K个省份定义为近邻,对应 w i j = 1 ,其余取零。
由于我国31个省份地理位置差异明显,黑龙江、西藏、新疆等边境省份邻近省份数量较少,而陕西、山西、湖南、湖北等内地省份的邻近省份数量相对较多,所以K-近邻空间矩阵权重定义对于本研究亦不合理。
基于以上分析可知基于地理邻近性的空间权重矩阵对于本例较为适宜。此情形下内蒙古、陕西都与8个省份相邻,具有较多的邻近省份。考虑到海南省孤立在外的特殊性,尽管海南和广西、广东在空间上并不相邻,但现实联系密切,故本研究直接令海南与广西、广东皆为近邻关系。
(二) 全局空间自相关
全局Moran指数可以从整体上反映我国各省份邮政快递业收入的集聚分布情况,检验各省份邮政快递业收入是否存在空间自相关。Moran指数取值范围为[−1, 1]。若取值(0, 1],说明各省份邮政快递业收入存在聚集关系;若取值[−1, 0),说明存在离散关系;而取值0值附近,说明存在随机关系。
全局Moran指数定义为:
I = ∑ i = 1 n ∑ j = 1 n ω i j x i − x ¯ s x j − x ¯ s ∑ i = 1 n ∑ j = 1 n ω i j , x ¯ = 1 n ∑ i = 1 n x i , s 2 = 1 n ∑ i = 1 n ( x i − x ¯ ) 2 , z = I − E ( I ) V a r ( I )
其中n为省份数量; x i 和 x j 分别为相应省份邮政快递业收入; w i j 为本文前述基于地理近邻性的空间权重矩阵;可基于相应莫兰指数的标准化变量z实现原假设为各省份邮政快递业收入随机分布的显著性假设检验。
(三) 局部空间自相关
局部Moran指数、局部Geary系数、局部 G i 系数都可用于测度一个省份的邮政快递业收入与其相邻省份之间的差异程度及相应显著性。
局域Moran指数 I i 基于相邻省份邮政快递业收入与全国相应收入均值进行比较而确定,定义为:
I i = x i − x ¯ s ∑ j = 1 n ω i j x j − x ¯ s
局部Geary系数 C i 基于相邻省份邮政快递业收入直接比较而确定,定义为:
C i = ∑ j = 1 n ω i j ( x i − x j / s ) 2 2 ∑ j = 1 n ω i j
局部 G i 系数不仅可度量相邻省份邮政快递业收入是否存在空间聚集,还可用于确定空间聚集类型,定义为:
G i = ∑ j = 1 n w i j x j ∑ j = 1 n x j , j ≠ i
Moran指数散点图横轴为各省份邮政快递业收入的标准化变量、纵轴为各邻近省份邮政快递业收入均值的标准化标量,拟合直线的斜率即为全局莫兰指数。Moran指数散点图中落在第一、三象限的省份在快递业收入上存在正向空间相关,落在第二、四象限省份存在负向空间相关。
局部Moran指数和局部Geary系数的共同缺点是无法区分空间聚集类型,即冷点(Cold spot)和热点(Hot spot)区域。冷点区域即低值聚集的区域,热点区域即高值聚集的区域。
(一) 各省份邮政快递业收入现状和趋势分析
2020年我国31个省份邮政快递业收入的分位数图示结果,如图1所示:
图1. 2020年我国31省份邮政快递业收入层次图
从图1中可以看出,我国邮政快递业收入的第一梯队主要分布在华东、华南沿海地区;第二梯队主要分布在华中、华东地区及西南地区的四川省,华南地区的福建省;第三梯队是部分华中地区,华南地区的内陆省份以及部分华北省份;第四梯队主要为东北地区及内蒙古、云南;第五梯队为西北地区。初步可确定我国邮政快递业收入水平具有一定的空间自相关性,可结合空间统计方法对其进行定量分析。
(二) 全局空间自相关分析
根据此前选定的基于地理邻接性空间权重矩阵,对我国各省份邮政快递业收入进行全局空间自相关分析,相应全局moran指数 I = 0.171 。置换次数为999次的显著性检验在1%显著性水平下拒绝了原假设,说明我国31个省份的邮政快递业收入在空间分布上具有显著的正向空间自相关(即存在空间依赖性),证实了图1所示结果。说明我国邮政快递业收入在空间分布上整体呈现集聚现象,即我国邮政快递收入较高的省份趋于和较高的省份靠拢,较低的省份趋于和较低的省份相邻的空间分布状态。
基于不同k值的k近邻空间权重矩阵设置,对我国31个省份的邮政快递业收入进行全局moran指数空间自相关分析,结果如表2所示。结果显示尽管K值不同,我国邮政快递业收入在空间分布上整体均呈现聚集趋势。
K值 | I值 | Z值 | P值 |
---|---|---|---|
3 | 0.126 | 1.4449 | 0.102 |
4 | 0.141 | 1.8662 | 0.054 |
5 | 0.102 | 1.7189 | 0.056 |
6 | 0.073 | 1.4785 | 0.086 |
表2. 不同K值下的全局空间自相关分析
横轴为2020年各省份邮政快递业收入,纵轴为各省份相邻省份2020年邮政快递业收入均值的散点图如图2所示。对该散点图进行回归拟合,对应斜率即为moran指数,此图进一步说明了moran指数所代表的实际意义。
图2. 各省份与相邻省份邮政快递业收入均值散点图
(三) 局部空间自相关分析
1) Moran指数散点图分析
局部moran指数散点图如图3所示,图中最高点对应为海南,相对于自身邮政快递业收入来说,其周边省份邮政快递业收入均值较高;最右点对应为广东,相对于周边省份而言,其自身邮政快递业收入较高。若去除广东,全局Moran指数将会更高,表明广东邮政快递业收入显著高于周边省份。对于邮政快递业而言,地区发展不平衡,广东应当充分发挥带动作用,促进省份间协调发展;海南本身人口较少且受自身地理位置影响,快递通常需经过空运或海运进行,因此邮政快递业务相对不发达,邮政快递业收入相对不高。
图3. 2020年中国31个省份邮政快递业收入Moran散点图
表3展示了各省份在图3中所处的象限。可以看到在京津冀地区中,北京市隶属第四象限,意味着相对于其自身来说,北京周边相邻省份邮政快递业收入较低;天津隶属于第二象限,意味着相对于其自身来说,天津周边相邻省份邮政快递业收入较高;河北隶属第三象限,说明河北及周边相邻省份的邮政快递业收入都不高。在长三角地区中,上海、浙江、江苏均隶属于第一象限,意味着三者及周边相邻省份的邮政快递业收入均较高;对比京津冀和长三角地区可以看出,京津冀三者分别位于第四、二、三象限,三省份之间的邮政快递业收入差距较大,这与京津冀地区的经济发展不协调具有相似特征;反观长三角地区,上海、江苏、浙江均位于第一象限,说明长三角地区的邮政快递业收入分布比较均衡,这亦与长三角地区的经济发展较为均衡具有相似特征。
2) 局部空间聚类图分析
我国各省份邮政快递业收入的局部Moran指数、局部Geary系数、局部Gi系数对应聚类图如图4~6所示,颜色深浅代表了不同的各省份与相邻省份在邮政快递业收入上的空间自相关程度。
象限 | 意义 | 省(市、自治区) |
---|---|---|
第一象限 | 高–高 | 上海、浙江、江苏、福建 |
第二象限 | 低–高 | 海南、江西、天津、安徽、广西 |
第三象限 | 低–低 | 黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、宁夏、青海、山东、西藏、河南、湖北湖南、云南、贵州、四川、重庆、河北、辽宁 |
第四象限 | 高–低 | 广东、北京 |
表3. Moran散点图下各省份对应象限图
图4. 各省邮政快递业收入Moran聚类地图
图5. 各省邮政快递业收入Geary聚类地图
图6. 各省邮政快递业收入局部Gi聚类地图
结果表明,华东地区的上海、浙江、江苏,华南地区的广东趋于被邮政快递业收入较高的省份所包围,带动作用十分明显,而西北部地区的新疆、西藏等省份邮政快递业收入较低,与经济发达地区的联系力度较弱,经济合作未在相关层面展开,趋于被邮政快递业收入较低的省份包围。
综合Moran指数聚类图与Geary系数聚类图可知,我国各省份邮政快递业发展具有显著的空间异质性,表现为邮政快递业收入较高的省份大多趋于集聚在长三角与珠三角,东北地区和中西部地区表现并为不显著。Geary系数聚类图中内蒙古、四川为低–低集聚区;江西、福建为高–高集聚;江苏、西藏结果不显著;在Moran指数聚类图中西藏为低–低集聚区;江苏为高–高集聚区;福建、江西不结果显著。实际情况是西藏处于西北地区邮政快递业低收入集群,江苏处于华东地区邮政快递业高收入集群,因此就邮政快递业收入的局部空间相关性而言,局部Moran指数相对局部Geary系数的分析结果更与实际情况相符。
局部Gi系数聚类图显示我国邮政快递业收入低值区主要集中在我国西北部,高值区主要集中在我国东南部,在整体趋势上与Moran聚类图具有相似趋势。在Moran聚类图中上海、浙江、广东三个省份为高–高集聚区,但在局部Gi系数聚类图中,上海、浙江、广东三个省份显著性检验未通过。结合实际情况可知,对于邮政快递业收入的局部空间相关性Moran指数相对Gi系数的分析结果更与实际情况相符。在局部自相关的三种标准下对应结果的显著性情况如表4所示。
指标 | P = 0.05 | P = 0.01 | P = 0.001 |
---|---|---|---|
Moran指数 | 内蒙古、宁夏、甘肃、江苏、福建、江西、海南 | 四川 | 新疆 |
Geary系数 | 内蒙古、河北、福建、江西、海南 | 新疆、河南、湖北、浙江、上海 | 无 |
Gi系数 | 内蒙古、甘肃、宁夏、浙江、福建、江西、海南 | 四川 | 新疆 |
表4. 显著性检验结果汇总表
(四) 双变量空间自相关分析
本文通过双变量Moran指数研究了我国各省份邮政快递业收入和相应省份人均可支配收入之间的空间交互关系。结果如表5所示。
双变量Moran指数 | 显著性检验 | LISA聚类地图 | ||
---|---|---|---|---|
0.257 | P值 | 0.01 | 高–高 | 浙江江苏上海 |
Z值 | 2.9318 | 低–低 | 新疆内蒙古陕西四川 |
表5. 双变量自相关分析
可以看到得益于上海的经济技术辐射,华东地区江苏、浙江经济持续高速发展,形成高收入–高消费的发展模式,广东自身经济实力强劲,邮政快递业收入与人均可支配收入皆居于上游,但与之相邻的湖南、广西、江西、海南等省份相对欠发达,广东与周边相邻省份之间经济合作力度较弱,经济合作在相关层面还未展开,因此广东与其相邻省份邮政快递业收入–人均可支配收入双变量下的空间联系表现并不显著。珠三角应在促进全省经济合作的基础上,进一步增大与周边省份的经济合作,充分发挥其经济优势与技术优势,带动周边省份经济发展,形成类似长三角的区域经济发展一体化。
本文利用我国2020年31个省份邮政快递业收入及相关社会经济发展指标等数据,借助空间统计分析方法,分析各省邮政快递业收入空间关联性及成因,得出以下研究结论:
1) 珠三角、京津冀地区邮政快递业收入空间自相关性明显,但对周边相邻省份的辐射带动作用不强;长三角地区邮政快递业收入的空间自相关性明显,且具有较强的辐射带动作用;西北地区整体处于邮政快递业收入落后的空间聚集状态;华中、东北、西南地区邮政快递业收入呈现空间集聚性但相对不明显。
2) 在未来的快递业发展中,珠三角、京津冀地区应借鉴长三角城市群的发展经验,利用北京、广州、深圳等中心城市的经济技术辐射,加强与周边城市、省份之间在经济领域内的各项合作,带动周边省份经济发展,形成类似长三角地区的经济发展一体化,从而实现共同富裕的奋斗目标。
本文受中国矿业大学(北京)大学生创新训练项目(空间统计分析)的支持。
乔 舰,谭佳宁. 中国邮政快递业收入区域差异研究A Study on the Regional Difference of China’s Postal Express Industry Income[J]. 统计学与应用, 2021, 10(02): 345-353. https://doi.org/10.12677/SA.2021.102034