辽宁拥有14个地级市,其中更是拥有两个副省级城市沈阳、大连,放眼全国也扮演着极其重要的角色。本文利用了因子分析的方法,根据相关经济指标计算出主因子得分以及14个城市的综合得分,给出排名。同时用系统聚类的方法对辽宁省14个城市进行了分类,画出谱系图。对当地政府对本地区的经济调控具有重要参考价值和极大的指导作用。 Liaoning has 14 prefecture-level cities, including Shenyang, Dalian and they play an important part in the whole country. Therefore, this thesis uses the factor analysis method, calculates the main factor score and the comprehensive score of 14 cities according to the relevant economic indicators, and gives the ranking. At the same time, 14 cities in Liaoning Province were classified and their pedigree maps were drawn by using the method of systematic clustering. It has an important reference value and a great guiding role for the local government in the economic regulation and control of the region.
刘兰苓,孙德山
辽宁师范大学,数学学院,辽宁 大连
收稿日期:2020年3月4日;录用日期:2020年3月20日;发布日期:2020年3月27日
辽宁拥有14个地级市,其中更是拥有两个副省级城市沈阳、大连,放眼全国也扮演着极其重要的角色。本文利用了因子分析的方法,根据相关经济指标计算出主因子得分以及14个城市的综合得分,给出排名。同时用系统聚类的方法对辽宁省14个城市进行了分类,画出谱系图。对当地政府对本地区的经济调控具有重要参考价值和极大的指导作用。
关键词 :因子分析,聚类分析,城市竞争力
Copyright © 2020 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
如果想要研究某一地区经济发展好坏,GDP是最好的衡量指标。但是要研究城市的综合竞争力,单看经济是不够的,还需要加入其他指标。国内外研究城市竞争力的方法很多,张晨瑶 [
与K均值聚类法相比,系统聚类法有一个优点是它可以输出一个有关各个观测的树形表示,称作谱系图。
系统聚类的谱系图可通过执行一个十分简单的算法得到。在执行该算法前,需要先定义观测之间的一些差异度量指标,其中最常用的是欧式距离。
系统聚类算法的实现:
1) 首先,计算n个观测中所有 ( n 2 ) = n ( n − 1 ) / 2 对每两个数据之间的相异度(比如欧式距离),将每个观测看作一类。
2) 令 i = n , n − 1 , ⋯ , 2 :
i) 在i个类中,比较任意两类之间的相异度,找到相异度最小的(即最相似的)那一对,将他们结合起来。用两个类之间的相异度表示这两个类在谱系图中交汇的高度。
ii) 计算剩下的 i − 1 个新类中,每两个类之间的相异度。
因子分析理论的形成,学术界一般认为是Charles Spearman提出的,他最先利用这种方法来测试学生智力得分,目前因子分析在社会经济等方面取得了巨大的发展。因子分析法主要是把一些过于复杂的变量转化成无关的新的因子的方法,它的思想把变量重新分组,分组的依据是相关性的大小,使得具有较高相关性的变量分到一组 [
因子分析和主成分分析的思想近乎一致,都是降维,但因子分析是主成分分析的推广,原始变量的相关矩阵是因子分析的出发点。
因子分析模型 [
{ X 1 = a 11 F 1 + a 12 F 2 + ⋯ + a 1 m F m + ε 1 X 2 = a 21 F 1 + a 22 F 2 + ⋯ + a 2 m F m + ε 2 ⋮ X p = a p 1 F 1 + a p 2 F 2 + ⋯ + a p m F m + ε p
称之为因子模型。它的矩阵形式为: X = A F + ε ,其中
A = [ a 11 a 12 ⋯ a 1 m a 21 a 22 ⋯ a 2 m ⋮ ⋮ ⋱ ⋮ a p 1 a p 2 ⋯ a p m ]
为因子载荷矩阵。
因子分析模型的假设:
1) X = ( X 1 , X 2 , ⋯ , X p ) ′ 是可观测随机向量,且 E ( X ) = 0 , cov ( X ) = Σ ,且 Σ 等于相关矩阵R。
2) F = ( F 1 , F 2 , ⋯ , F m ) ′ ( m < p ) 是不可观测的变量, E ( F ) = 0 , cov ( F ) = I ,即向量F的各个分量是互相独立的。
3) ε = ( ε 1 , ε 2 , ⋯ , ε p ) ′ 与F相互独立,且 E ( ε ) = 0 , ε 的协方差矩阵 Σ ε 是对角阵:
cov ( ε ) = Σ ε = [ σ 11 2 0 σ 22 2 ⋱ 0 σ p p 2 ]
即 ε 的各分量之间也是互相独立的。
因子载荷的求解:
因子分析大致可分为三个步骤:确定因子载荷、计算因子得分、因子旋转。本文主要是运用主成分法确定因子载荷,设 m < p ,其中一个因子载荷矩阵为:
A = ( λ 1 γ 1 , λ 2 γ 2 , ⋯ , λ m γ m )
其中 λ 1 ≥ λ 2 ≥ ⋯ ≥ λ p 是样本相关矩阵R的特征根, γ 1 , γ 2 , ⋯ , γ p 为对应的标准正交化后的特征向量。
我们选取2017年辽宁省14个地级城市的相关数据指标,生产总值记为 x 1 ,人均生产总值记为 x 2 ,固定资产投资记为 x 3 ,社会消费品零售总额记为 x 4 ,第三产业记为 x 5 ,财政预算收入记为 x 6 ,财政预算支出记为 x 7 ,公路货运量记为 x 8 ,公路客运量记为 x 9 ,普通高等学校专任教师数量记为 x 10 ,科技活动人员记为 x 11 ,医疗卫生机构数量记为 x 12 ,进出口总额记为 x 13 同样地,我们依然需要对数据进行归一处理。
利用R软件进行因子分析,取三个因子,可得到因子载荷矩阵如表1。
Factor1 | Factor2 | Factor3 | |
---|---|---|---|
x1 | 0.999 | 0 | 0 |
x2 | 0.827 | −0.464 | 0.310 |
x3 | 0.984 | 0 | 0.110 |
x4 | 0.980 | 0.190 | 0 |
x5 | 0.996 | 0 | 0 |
x6 | 0.993 | 0 | 0 |
x7 | 0.987 | 0.127 | 0 |
x8 | 0.832 | −0.156 | 0.118 |
x9 | 0.820 | 0.475 | 0.216 |
x10 | 0.925 | 0.324 | 0 |
x11 | 0.989 | 0.132 | 0 |
x12 | 0.675 | 0.437 | 0 |
x13 | 0.859 | −0.364 | −0.354 |
表1. 因子载荷矩阵
由表1,我们可以发现第一主因子基本稳定在0.90附近,也就是说,第一主因子之间相差不大,进而方差就不大,这就很难能解释背后的意义,但因子分析与主成分分析的不同在于因子分析的结果可通过因子旋转使得更容易用业务知识加以解释,本次分析为了使的因子更容易加以解释,我们可以进行因子旋转 [
Factor1 | Factor2 | Factor3 | |
---|---|---|---|
x1 | 0.663 | 0.491 | 0.564 |
x2 | 0.256 | 0.898 | 0.351 |
x3 | 0.639 | 0.599 | 0.463 |
x4 | 0.784 | 0.401 | 0.470 |
x5 | 0.700 | 0.465 | 0.540 |
x6 | 0.733 | 0.487 | 0.473 |
x7 | 0.731 | 0.402 | 0.547 |
x8 | 0.451 | 0.599 | 0.410 |
---|---|---|---|
x9 | 0.924 | 0.268 | 0.137 |
x10 | 0.860 | 0.339 | 0.337 |
x11 | 0.750 | 0.450 | 0.481 |
x12 | 0.780 | 0.143 | 0.163 |
x13 | 0.234 | 0.455 | 0.856 |
表2. 因子旋转后的载荷矩阵
同时我们也可以得到每个主因子的贡献率以及累计贡献率,如表3。
Factor1 | Factor2 | Factor3 | |
---|---|---|---|
贡献率 | 0.470 | 0.243 | 0.229 |
累积贡献率 | 0.470 | 0.713 | 0.943 |
表3. 主因子的贡献率以及累积贡献率
利用R软件进行因子分析程序设计,可计算出各个因子的得分以及综合得分,通过比较各个城市的综合得分,可给出各个城市的综合竞争力排名,如表4。
城市 | Factor1 scores | Factor2 scores | Factor3 scores | Composite score | ranking |
---|---|---|---|---|---|
沈阳 | 3.294020714 | 0.53868719 | −0.74873055 | 1.59876079 | 1 |
大连 | 0.244090369 | 1.39313798 | 3.14117031 | 1.24346024 | 2 |
鞍山 | 0.016129662 | 0.01761694 | −0.20713262 | −0.03772165 | 3 |
锦州 | 0.004550783 | −0.48327531 | −0.11149573 | −0.14934205 | 4 |
营口 | −0.580007339 | 0.58118809 | −0.24324958 | −0.19838695 | 5 |
盘锦 | −0.930436887 | 2.23713634 | −1.31569521 | −0.20676077 | 6 |
抚顺 | −0.313436173 | 0.24827297 | −0.51241546 | −0.21667848 | 7 |
丹东 | −0.215868013 | −0.63498109 | 0.09657745 | −0.24776472 | 8 |
葫芦岛 | −0.128610039 | −0.86533152 | 0.08508876 | −0.26642307 | 9 |
朝阳 | −0.080706426 | −1.01743717 | 0.14525385 | −0.26713268 | 10 |
铁岭 | −0.034014638 | −1.21356812 | 0.14473591 | −0.29452748 | 11 |
辽阳 | −0.435710847 | 0.05392598 | −0.38073095 | −0.29572373 | 12 |
本溪 | −0.632672233 | 0.26284897 | −0.24550995 | −0.30721678 | 13 |
阜新 | −0.207328933 | −1.11822126 | 0.15213378 | −0.35454266 | 14 |
表4. 城市综合竞争力得分及排名
由表4可看出,在辽宁省14个城市中,沈阳,大连保有绝对优势。沈阳作为辽宁省的行政中心,也是东北三省的中心城市,其实力毋庸置疑。而大连作为副省级城市,也是计划单列市,并且拥有沿海优势,其实力丝毫不弱于沈阳。相比沈阳、大连,辽宁省其他城市的竞争力不足,鞍山作为辽宁第三大城市,东北最大的钢铁工业城市,在改革开放的进潮中,逐渐被拉开差距。锦州作为辽宁省西部区域性中心城市,很好的完成了模范带头作用。而阜新本溪等城市,由于经济相对落后,故在竞争力排名中很难有所突破。为了直观比较出近几年辽宁省14个城市的发展状况,我们选取了2016年和2015年辽宁省各个城市的发展指标,同样利用因子分析给出排名,排名结果见表5。
2015年 | 2016年 | |||
---|---|---|---|---|
城市 | Composite score | ranking | Composite score | ranking |
沈阳 | 1.7164530 | 1 | 1.75905492 | 1 |
大连 | 1.1947532 | 2 | 1.20522468 | 2 |
鞍山 | 0.0142542 | 3 | −0.01393658 | 3 |
锦州 | −0.1588124 | 4 | −0.15436021 | 4 |
营口 | −0.2456962 | 9 | −0.23976681 | 6 |
盘锦 | −0.3207371 | 12 | −0.28526957 | 11 |
抚顺 | −0.2409794 | 8 | −0.23517088 | 5 |
丹东 | −0.2303807 | 6 | −0.28203394 | 10 |
葫芦岛 | −0.2715287 | 10 | −0.26552303 | 9 |
朝阳 | −0.2261834 | 5 | −0.24664924 | 7 |
铁岭 | −0.2378227 | 7 | −0.25507771 | 8 |
辽阳 | −0.3131425 | 11 | −0.30718412 | 12 |
本溪 | −0.3497113 | 14 | −0.33369722 | 13 |
阜新 | −0.3304661 | 13 | −0.34561091 | 14 |
表5. 2015和2016年辽宁各城市综合得分及排名
为了更直观的比较出辽宁省各城市在2015~2017年间的发展变化,我们画出了这三年各城市的竞争力排名折线图,如图1。
图1. 2015~2017年辽宁各城市竞争力排名折线图
由折线图1可知,近三年来,沈阳、大连、鞍山、锦州发展较为稳定;盘锦,营口稳中有升;丹东,抚顺并不稳定;铁岭,朝阳却持续下降。因此,在接下来辽宁省的发展中,要继续保持沈阳大连的领先优势,也要兼顾阜新,本溪等持续前进,更希望本溪能够利用沈阳经济圈打造自身优势。同时铁岭,朝阳也要发现问题,总结不足,及时止住下降的趋势。
利用R对辽宁省14个地级城市相关数据进行系统聚类分析,数据选取2017年的相关指标,可得谱系图如图2。
图2. 系统聚类谱系图
由谱系图可知,辽宁省14个城市大致可以分为四类:即第一类为沈阳;第二类为大连;第三类为鞍山、锦州、营口、盘锦;第四类为阜新、朝阳、铁岭、葫芦岛、抚顺、辽阳、本溪、丹东。如此分类也从因子分析得到的各城市的因子得分排名得到了印证。由系统聚类结果,沈阳、大连各自为一类,说明近年来大连的发展似乎遇到的一些瓶颈,与同省的沈阳已拉开差距,最新的中国城市等级分类中沈阳成功进入新一线城市行列,而大连却由新一线降为二线城市,这也使本文的聚类结果得到了印证。
辽宁省自然科学基金指导计划项目(编号:2019-ZD-0471)。
刘兰苓,孙德山. 基于因子分析的辽宁省城市综合竞争力评价分析Evaluation and Analysis of Comprehensive Competitiveness of Liaoning Province Based on Factor Analysis[J]. 应用数学进展, 2020, 09(03): 421-428. https://doi.org/10.12677/AAM.2020.93051