1. 引言
迁移人口的规模与方向和国家的发展政策密切相关。建国初期到改革开放期间,实行的计划经济和户籍管理制度对人口迁移起到一定的阻碍作用,改革开放后,随着户籍制度的放宽和城市化进程的推进,迁移人口的规模呈现出不断扩大的趋势,尤其在进入21世纪以后,国家推出一系列区域发展规划,促进了人口迁移的活跃度,人口的空间格局因此也发生了变化 [1]。人口的空间分布和空间流动深刻影响着劳动力资源的分配、规模以及区域经济的发展,而劳动力资源作为社会经济增长中最有活力、最有潜力的资源,对于推动社会发展具有基础性和决定性作用。
从已有的研究来看,学者们通常是对全国或者某个省份范围的分析,鲜有从城市群视角出发对于人口迁移空间分布规律的研究。而且现有的关于影响因素的研究较少涉及文化因素的影响。考虑到现有的人口分布格局依旧以胡焕庸线为分界,而城市群的划分目前也相对稳定 [2],因此本文从城市群视角研究人口迁移的规律和趋势,对2010年至2015年我国人口迁移活动的时空分布、变化规律及影响因素进行探索,以期对我国的流动人口研究进行进一步完善,并对我国的区域经济发展、新型城镇化建设以及人口政策提供一定的参考,这对于推进新型城镇化建设、制定科学合理的区域发展规划和人口政策具有现实意义。
2. 研究设计
2.1. 指标选取
2.1.1. 流动人口比例
采用流动人口比例这一指标作为总量指标,计算公式如下:
其中,
为i地区的流动人口比例,
为i地区的户籍人口,
为i地区相的年末总人口。
2.1.2. Fractionalization指数和Shannon指数
采用fractionalization指数和Shannon指数 [3] 这两个指标作为结构指标,计算公式如下:
其中,S是r地区迁往j地区的人口所占的比例,r是该地区人口中所代表的不同的城市数目。
Fractionalization指数为0时,表示该地区的人口全部是土生土长的本地人口,随着迁入地多样性的增加,其值会增大,最大值接近1。该指数通常用来描述测量两个随机抽取的个体户籍为不同地区的概率,就迁移的深度和广度而言具有明显的衡量优势。Shannon指数是生态学领域用来测度物种异质性的一个指数,其值越大表示不确定性越大、未知因素越多,即多样性越高。本研究将Shannon指数应用于研究城市群迁移人口多样性,依据生物学中的定义应用到人口研究中,可以认为,Shannon指数越高表示该区域人口来源地不确定性越大,即人口多样性越高。研究表明,这两个指标得到的结果应该是强相关的,但并不完全一致。Shannon指数对于分组大小不等的分布偏离更为敏感,在群体大小没有显著区别的情况下,Fractionalization指数更能体现群体的多样性 [4] [5]。
2.2. 数据来源
本文所涉及的人口数据主要来源于2010年《中国第六次人口普查资料》、2015年《全国1%人口抽样调查资料》以及各省市相关年份的统计年鉴。社会经济数据主要来源于2011年和2016年《中国统计年鉴》和《中国城市统计年鉴》。考虑到各地年鉴数据统计方式存在差异,对于部分缺失的数据采用平滑修补的方式处理。相关的地理信息、图形数据来源于国家基础地理信息系统数据库,运用ARCGIS 10.2和GeoDa-1.18.0软件进行数据处理和分析。
2.3. 研究方法
2.3.1. 空间自相关
1907年Tobler提出了“地理学第一定律” [6],他认为任何事物与其他事物都是相关的,而且距离越近,关联性越强,这种关联性被称为空间相关性。本文采用Global Moran’s I指数刻画全局空间自相关。
其中,n为空间单元总数,
、
是空间位置i和j的观察值,
为均值,
为方差,
是空间权重,表示空间位置i、j的位置关系。
Global Moran’s I的取值范围为[−1,1],在(0,1]区间时表示测度区域存在正相关;在[−1,0)区间时表示测度区域存在负相关。全局Moran’s I指数的绝对值越大,表示空间自相关性越大,若值趋近于0,则表明观测值的空间分布是随机的,不存在空间自相关关系。
2.3.2. 多元线性逐步回归
回归分析的核心思想是建立在若干个解释变量和一个因变量的函数关系,并通过函数关系对因变量的变化规律进行解释和预测 [7]。一般来说解释变量通常不是一个而是多个,因此需要进行多元线性回归分析。多元线性回归是利用多个解释变量的观测值来拟合被解释变量并且确定各个解释变量之间的线性关系,检验各解释变量的显著性,比较它们对目标变量的影响程度 [8]。
在回归模型中,由于变量较多,变量之间可能会存在各种联系,回归模型可能会受到多重共线性的影响,而逐步回归可以很好的解决这个问题 [9]。考虑到本次研究选取的自变量数量较多,为了避免多重共线性对回归结果的影响,筛选出对因变量影响最为显著的因素,采用逐步回归分析法。
2.4. 回归模型构建
2.4.1. 变量选取
1) 自变量——流动人口比例。
联合国《多种语言人口学辞典》将“人口迁移”定义为:人口在两个地区之间的地理流动或者空间流动,这种流动通常会涉及到永久性居住地由迁出地到迁入地的变化 [10]。但是在我国,由于户籍制度的存在,出现了“人口迁移”和“人口流动”这两个概念,主要区别在于迁移活动是否涉及到户籍的改变。国外的学者将这两者统称为人口迁移,Arthur Haupt和Tomas T. Kane在《Population Handbook》中将其定义为“人们为了永久或半永久定居的目的,越过一定边界范围的地理移动” [11]。
基于以上分析,考虑到数据的可得性和本次研究的实际情况,本文对流动人口和迁移人口不做严格区分,参考杨晔等 [12] 对城市移民的定义,将“迁移人口”定义为户籍地与居住地不一致的人,在人口普查资料中对应“全省按现住地、性别分的户口登记地在外省的人口”。在本研究中考虑到区域人口的流入和流出效应,采用流动人口比例作为自变量。
2) 因变量
通过对既有研究文献进行归纳总结 [13] - [18],并且考虑相关数据的可得性,本研究最终确定了四个对人口迁移活动可能存在影响的一级指标,分别为经济发展水平、社会发展水平、文化发展水平和生态发展水平,这四个一级指标被分解为12个具体的解释变量,这些解释变量及描述性统计见表1。可以看出,这些自变量的观测值标准差较大,说明不同城市的经济、社会、文化、生态发展水平具有较大差距。
Table 1. Descriptive statistical results of variables
表1. 变量描述性统计结果
2.4.2. 模型构建
以流动人口比例作为被解释变量,建立多元线性回归模型:
其中,Y为因变量,
为选取的自变量,
为回归常数,
是未知参数,
为随机误差项。
3. 实证分析
3.1. 人口迁移的空间分布研究
3.1.1. 总量维度分析
本文采用流动人口比例这一指标来衡量总量维度,计算结果如表2所示。
Table 2. Total index results of five urban agglomerations
表2. 五大城市群总量指标结果
从时间维度来看,除了长三角城市群,其余四个城市群的户籍人口均有所增加,年末总人口也是增加趋势,说明这四个城市群均为人口迁入地区。流动人口的增长率呈现出从北到南逐渐递减的规律。流动人口比例也都有了不同幅度的上升。从空间维度看,珠三角城市群的流动人口比例远远高于其他城市群,尤其是到2015年达到了0.806,是成渝城市群的15倍之多。珠三角城市群的流动人口增量在两年内均位于首位,由此可见,珠三角作为广东最发达的地区,显现出极强的人口吸引力。
从总量方面的分析可以看出,大部分地区的流动人口比例并不高,城市中更多的还是本地居民,比如成渝城市群和长江中游城市群2010年的流动人口比例为负数,说明本地户籍人口比年末总人口还要多,人口是净流出的。相比较而言,珠三角城市群则恰恰相反,在2010年其流动人口比例就达到了46.1%,流动人口占到了年末总人口的接近一半,而到了2015年,该比例增加到80.6%,可以说珠三角城市群中的绝大多数都是迁移人口,是个外来人口相对较多的地区。由此可见,在总量维度上,流动人口的空间分布差异还是比较大的。
3.1.2. 结构维度分析
本文采用fractionalization指数和shannon指数这两个指标来衡量结构维度,结果如表3所示。
Table 3. Structural index results of five major urban agglomerations
表3. 五大城市群结构指标结果
从时间维度来看,五个城市群的流动人口多样性变化规律较为明显:北部和中部的三个城市群指标均有所增加,表示其人口流动来源更加多样,而成渝城市群和珠三角城市群的指标有小幅下降,表示其流动人口多样性有减弱的趋势,呈现出北部和中部增加、南部减少的趋势。从空间维度看,2010年和2015年五个城市群的结构指数排序均为:珠三角城市群、长三角城市群、京津冀城市群、成渝城市群、长江中游城市群。fractionalization指数和shannon指数结果具有一致性。
从结构方面的分析可以看出,2010年到2015年间,来自全国各地的流动人口更加倾向于经济发达的东部、南部沿海城市,其对应的三大城市群也因为有了来自各个地区劳动力的建设,其经济、技术、社会各方面发展迅速,形成了优势累积,继续吸引着不同地区的人才,形成人口拉力的“马太效应”,且短期内这种趋势将一直持续下去。
3.2. 人口迁移活动的空间自相关研究
运用GeoDa-1.18.0软件对流动人口比例、fractionalization指数、shannon指数分别计算全局Moran’s I指数,具体结果见表4。
Table 4. Global Moran’s I index of each index in 2010 and 2015
表4. 2010年和2015年各指标全局Moran’s I指数
注:表中对Moran’s I的推断是基于Anselin的999次随机序列。
可以看出,2010年和2015年五大城市群内的地级市人口迁移活动相关指标的全局Moran’s I指数均大于0,无空间相关假设成立的概率小于1%,说明在99%置信度下,人口迁移活动存在着显著正向的空间自相关性,即人口迁移活动会受相邻区域的影响,流动人口比例接近的城市在空间上趋向集中分布。此外,三个指标的全局Moran’s I指数均呈现出减小的趋势,说明空间正相关性逐渐减弱,空间分布不均衡性正在缓解,人口迁移活动向着区域协调发展转变。
3.3. 人口迁移活动的影响因素分析
运用SPSS 25.0软件对研究区域2010年和2015年的数据分别进行多元线性逐步回归,结果见表5和表6。
Table 5. Stepwise regression results in 2010
表5. 2010年逐步回归结果
Table 6. Stepwise regression results in 2015
表6. 2015年逐步回归结果
3.3.1. 2010年人口迁移活动影响因素分析
结果显示,调整后的R方为0.871,最终模型整体拟合效果良好。F值为121.179,p = 0.000 < 0.05,通过F检验,说明自变量与因变量之间存在线性关系,整体回归效果显著。Durbin-Watson值为1.895,认定残差独立,通过检验。
通过逐步回归,最终确定影响显著的变量有五个,分别是人均GDP、建成区绿化覆盖率、每万人拥有卫生机构床位、人均邮电业务量、城镇生活污水处理率,其余变量对因变量影响不明显,被剔除。根据结果,2010年流动人口比例与其影响因素之间的关系为:
3.3.2. 2015年人口迁移活动影响因素分析
分析结果显示,最终模型调整后的R方为0.773,整体拟合效果较好。F值为61.639,p = 0.000 < 0.05,通过F检验,说明自变量与因变量之间存在线性关系,整体回归效果显著。Durbin Watson值为1.652,认定残差独立,通过检验。
通过逐步回归,最终进入模型的变量有五个,分别是人均邮电业务量、人均GDP、人均城市道路面积、每万人拥有卫生机构床位、每百人公共图书馆藏书。其余变量对因变量影响不明显,被剔除。根据回归结果,2015年流动人口比例与其影响因素之间的关系为:
3.3.3. 2010~2015年人口迁移活动影响因素比较
对2021年和2015年的逐步回归结果进行对比,结果如表7所示。
Table 7. Comparison of stepwise regression results in 2010 and 2015
表7. 2010年和2015年逐步回归结果对比
注:a.预测变量:(常量),X1:b.预测变量:(常量),X1,X10;c.预测变量:(常量),X1,X10,X5:d.预测变量:(常量),X1,X10,X5,X4;e.预测变量:(常量),X1,X10,X5,X4,X11;f.因变量:Y。(2010年)
a.预测变量:(常量),X5:b.预测变量:(常量),X5,X1;c.预测变量:(常量),X5,X1,X6:d.预测变量:(常量),X5,X1,X6,X4;e.预测变量:(常量),X5,X1,X6,X4,X7;f.因变量:Y。(2015年)
通过对比2010年和2015年人口迁移活动的影响因素分析发现,有三个因素对两个年度人口迁移的选择都产生影响。一是人均GDP高的地方,流动人口比例高,经济发达地区一般城市化水平较高,二三产业发达,就业机会较多且工资水平相对较高,对于劳动力的吸引力具有显著优势,导致人均GDP因素对人口迁移有较大影响,通过分析发现,从2010年到2015年,人均GDP的影响程度呈现出减弱的趋势,这可能是因为随着社会的不断发展,迁移人口开始考虑除了经济发展水平之外的因素,如社会福利水平、环境宜居情况、生活成本等,经济对于人口迁移的影响将会逐渐减小。二是人均邮电业务量高的地方,流动人口比例较高。邮电业务总量可以有效反映一个地区的经济发展水平、商业化程度、科技化水平和城市化水平,这是因为越是经济、科技发达的地方,信息量就越大,人与人之间的交流就越频繁,通信量就越大,这些地区对于迁移人口的迁移选择表现出显著正向的影响。三是每万人拥有卫生机构床位越多的地区,流动人口比例越低,且负相关系数呈现增加趋势。人均卫生机构床位数代表着一个地区的医疗服务资源水平,迁移人口中大部分都是青壮年劳动力,本研究表明一个地区的医疗服务水平不能成为明显的人口“拉力”,但为何会成为人口“推力”且影响程度越来越显著,原因有待考证。另外,值得关注的是,2015年回归模型中增加了每百人公共图书馆藏书这一正相关变量,表明文化发展水平这一因素开始在人口迁移活动中表现出正向的影响。
综上所述,通过多元线性逐步回归,得出结论:人口迁移活动的影响因素主要是经济发展水平和社会发展水平,经济发展水平高,科技化、市场化发展良好的地方对迁移人口有着明显的吸引力;同时,文化发展因素开始表现出正向的人口迁移影响力。
4. 结论与展望
本文利用2010和2015年的相关数据,研究城市群视角下人口迁移的空间演化和影响因素,主要研究结论包括:
1) 人口迁移活动的空间差异在五年内没有显著变化,发展较早、经济较发达的三大城市群地区人口迁移活动相对活跃,不仅流动人口比例高,人口的来源地也更复杂,具有较大的人口拉力。其中,珠三角城市群流动人口比例显著高于其余研究地区且增速强劲,具有很强的发展潜力。
2) 人口迁移活动存在着显著的正向空间自相关关系,活跃度接近的区域在空间上趋向于集中分布。但是这种趋势呈现出减弱的趋势,空间分布的不均衡性逐渐缓解,人口迁移活动向着协调发展转变。
3) 经济、社会发展水平仍然是影响人口迁移的主要因素,经济发达且科技化、市场化发展良好的地区具有显著的人口拉力。同时,随着时间的推移,文化发展因素开始显现出正向的人口迁移影响。
由于研究条件的限制,本文存在着一定的不足之处。如研究期内存在部分数据统计口径不一致和数据缺失现象,虽然进行了较为科学的补全,但是仍然与实际情况有一定的差异。同时由于2020年第七次全国人口普查的数据尚未公布,使得本文的研究范围有一定的局限性,不能准确反映近些年的情况。因此,受数据可得性的影响,本文的研究结果会有一定的偏差与影响。另外对于影响因素的分析,本文仅考虑了经济、社会、文化、生态发展水平这个方面,未来的研究可以考虑加入创新水平、气候环境等因子进行更加全面深入的探索。
基金项目
国家社会科学基金项目(19BGL047)。