1. 引言
新型冠状病毒(COVID-19)属于β属冠状病毒,主要传播途径为经呼吸道飞沫和密切接触传播,接触病毒污染的物品也可造成感染,在相对封闭的环境中长时间暴露于高浓度气溶胶情况下存在经气溶胶传播的可能 [1]。COVID-19的流行过程具有较强的聚集性特征,先在某地(如武汉华南海鲜批发市场)爆发成为一级传染点,感染者通过人口流动等形式携带病毒传播至下一级传染点,从而导致疫情在大范围内进行传播。因此,对于COVID-19病例的聚集区域(特别是县级尺度)的研究和原因分析,对城市开展疫情防控具有重要的借鉴意义。
目前,国内外已有大量关于COVID-19疫情的研究,主要集中在临床研究、流行病学调查研究、疫情对社会的影响等,如Backer J A [2] 等通过对早期疫情阶段在武汉市意外发现的88里确诊病例的旅行史和症状,分析COVID-19的平均潜伏期约为6.4天。中国疾病预防控制中心新型冠状病毒肺炎应急响应机制流行病学组 [3] 根据内地报告72,314例病例对COVID-19流行病学特征进行分析研究,新型冠状病毒肺炎传播流行迅速,随着人们返回工作岗位,需积极应对可能出现的疫情反弹。沈国兵 [4] 发现此次疫情已经给我国外贸和就业以及全球产业链和供应链带来严重不利冲击,加剧了我国巨量高校毕业生叠加农村城镇化的大量人口的就业压力。目前,针对病例聚集的研究尺度主要有国家、省、市、县等,如Kang D [5] 等从中国省级尺度研究疫情的空间相关性;曾永明 [6] 等从市级角度分析人口流动与城市早期新冠肺炎疫情的时空扩散和分布关系;张延炀 [7] 等从县级角度分析发现河南省COVID-19存在空间聚集性,传播风险经历弱–强–弱的变化过程。这些研究表明,COVID-19的时空聚集性在不同空间尺度上有不同特点,微观层面的COVID-19疫情空间聚集特点和因素分析对疫情防控工作的开展起到重要作用。
广东省截止2020年3月1日24时累计确诊病例已达1350例,累计出院1034例,累计死亡7例,其确诊病例仅次于湖北省,排全国第二。同时,广东省扼守中国南大门,是粤港澳大湾区重要组成省份,是我国重要交通枢纽和人流、物流中心,在全国疫情防控工作中具有战略性意义。因此,本文基于病例个体数据,研究分析广东省的疫情时间发展变化过程、病例性别和年龄构成特点,再基于县级尺度分析病例时间序列变化与空间聚集特征,并进一步分析空间聚集影响因素,为今后重大安全事件防控提供决策参考。
2. 数据与方法
2.1. 数据来源
病例数据全部来自广东省以及21个地级市卫健委官方网站和官方公众号新冠肺炎疫情情况通报的数据(2020年1月19日~2020年3月1日)。收集的病例信息包括所属县区、性别、年龄、确诊时间、是否有境外旅居史等。根据病例是否有境外旅居史以及感染原因,剔除境外输入病例,保留境内确诊病例。在2020年1月19日~3月1日,广东省共确诊1350例,经过数据处理与甄别,本文采用其中符合本次研究的1272例病例,约占总确诊病例的94%。
以全国地理信息资源目录服务系统提供的2019年版1:100万矢量地图为基础,根据需求利用ArcGIS 10.2提取出广东省县级行政区域矢量地图,包括64个市辖区、20个县级市、34个县、3个自治县,由于东莞市和中山市行政单位划分的特殊性,本文根据卫健委发布的病例归属信息,特将两个城市分别划分为34和24个镇。通过县级国标码将病例数据与广东省县区边界地理数据进行关联,利用EXCEL和ArcGIS 10.2建立广东省COVID-19的GIS数据库。
人口流动是疫情聚集性爆发的重要原因,由于数据的限制,本文采用广东省2019年常住人口和年末户籍人口的差来表示人口流动规模。2019年常住人口、2019年年末户籍人口、人均GDP、限额也上餐饮业餐饮费收入等数据均来自《广东省2020年统计年鉴》和各地级市统计年鉴。
2.2. 研究方法
本文主要从时间与空间两个维度对广东省疫情聚集性特征进行分析,在时间上基于logistic增长曲线拟合分析广东省确诊病例趋势变化过程,空间上分析广东省确诊病例聚集性变化趋势与聚集具体情况,最后结合因子分析与多元回归分析的方法,进一步探究疫情的空间分布影响因素。
2.2.1. 全局空间自相关
本文选取Moran’s I指数来识别新冠肺炎病例的全局空间自相关性,其公式为:
(1)
式(1)中,xi,xj为第i,j县区的新冠肺炎报告患病率,x为全省所有县区新冠肺炎平均报告患病率;wij为第i,j县区的空间矩阵;n为所有县区数。Moran’s I的取值范围为[−1, 1],0表示空间不相关,[0, 1]表示空间正相关,[−1, 0]表示空间负相关。Z检验评价Moran’s I的统计学意义,计算公式如下:
(2)
式(2)中:E(I)和VAR(I)分别是Moran’s I指数的期望和标准差。在给定的显著性水平下,若Moran’s I显著且为正值,表示确诊病例较多(或较少)的县区显著集聚,即存在正相关。若Moran’s I显著且为负值,表示县区间确诊病例数具有显著的空间差异,即存在负相关。当Moran’s I接近E(Ii)时,表示单元呈随机分布。
基于目前流行病学调查和研究结果,新型冠状病毒(COVID-19)潜伏期为1~14天,多为3到7天 [8]。广东省在2020年1月19日出现第一例新冠肺炎确诊病例,为深圳确诊,按照诊断报告日期,本文将新冠肺炎确诊病例在广东省的情况分为6个时段,以7天为一个周期,选取1月26日、2月2日、2月9日、2月16日、2月23日、3月1日这六天的广东省各县区累计确诊病例数进行空间自相关分析。
2.2.2. 热点分析
全局莫兰指数可以识别疫情在空时间上是否具有相关性,但是未能准确识别聚集区域和热点区域。故本文引入局域Getis-Ord
指数来进一步识别广东省确诊病例在县级单位上的热点,主要利用ArcGIS 10.2进行计算Getis-Ord
指数并输出图表,若指数得分为正值且较大,说明这个空间单元为高值聚类单元,即此单元为高病例单元,相反则为低值聚集单元。公式如下所示:
(3)
(注:式(3)中所有符号的释义同式(1))。
2.2.3. 疫情空间分布影响因素分析
为了分析县级尺度下疫情的空间分布因素,从人口流动、交通客运、经济水平、餐饮零售中选取4个变量来进行实证研究(表1)。首先使用SPASS软件进行KOM值检验这4个因子的相关性,KOM值在0与1之间,当KOM值越接近1,意味着变量间的相关性就越强,越适合做因子分析;当KOM值越接近0时,意味着相关性越低,越不适合做因子分析。然后使用Bartlett球形度检验因子分析方法的适用性,sig值小于0.05则说明符合标准,数据呈球形分布,各变量相互独立,适合做因子分析。最后使用多元回归分析法,3个因子作为自变量,各县级累计确诊病例作为因变量,以此分析不同因子对疫情空间的影响力。
Table 1. Moran’s I statistics of the total number of confirmed cases in Guangdong Province
表1. 广东省累计确诊病例数全局Moran’s I各统计量
3. 结果
3.1. 疫情时间变化特征
在研究时段内(如图1),广东省疫情发展可以大致分为四个阶段:1月19日至1月27日,为疫情上升期,平均日报告17例;1月28日至2月8日,为疫情高发期,平均日报告81例;2月9日至2月16 日,为疫情下降期,平均日报告26例;2月17日至3月1日,为疫情低水平波动期,平均日报告3例,新增确诊人数总体上呈现先快速上升后缓慢下降的变化趋势。新增确诊病例的时间变化规律受到公共卫生响应事件的影响,1月23日武汉市采取“封城”措施、同日广东省启动重大突发公共卫生事件一级响应、2月4日广东省要求小区实施封闭管理等对疫情防控起到重要作用。
Figure 1. Changes in the number of newly diagnosed patients from January 26 to March 1, 2020 in Guangdong Province
图1. 广东省2020年1月26日至3月1日新增确诊人数变化
3.2. 疫情空间变化特征
3.2.1. 空间自相关分析
本文把广东省划分为179个县级行政单位,其中132个行政单位存在病例,约占74%,疫情防控任务艰巨。从各区县收疫情影响程度来看(如图2),病例数最多的是深圳市的南山区(87例),其次为深圳市的福田区(81例),再次者是广州市白云区(74例);从市级尺度来看,云浮市病例数为0,受影响程度较小,而阳江市、江门市、中山市、广州市、深圳市的全部县区都受到疫情的影响,疫情较为严重。确诊从数量结构上看,多数县区的病例数都集中在10例以下。
Figure 2. Cumulative number of confirmed cases in Guangdong Province as of March 1, 2020
图2. 截止2020年3月1日广东省累计确诊病例数
通过研究发现,Moran’s I指数均大于零,Z得分均大于2.58,P值均小于0.01,聚集概率大于99% (如表2)。这表明广东省各县区确诊病例接近的县区在空间上不是随机分布,新冠肺炎疫情在县级水平上呈现空间正相关,意味着广东省新冠肺炎疫情的县级单元在空间上表现出较强的聚集性。即新冠肺炎疫情严重县区趋于与严重的县区相邻,或者疫情较低的县区与较低的县区相邻。从时间上看(如表1),2020年1月26日至3月1日选取的时间节点中,Moran’s I整体上呈现上升趋势,表明广东省新冠肺炎疫情聚集趋势由相对较弱转变为较强。该变化趋势指出广东省新冠肺炎疫情在各区县的关联程度逐渐增强,整体上保持较为稳定的空间正相关关系,新冠疫情呈现弱聚集向更强聚集态势的转变。但是全局Moran’s I并没有明确指出病例的热点聚集区,为了进一步分析广东省新冠肺炎的热点区域具体位置,特引入热点分析进一步阐释。
Table 2. Case distribution and factor linear regression analysis results
表2. 病例分布与因子线性回归分析结果
3.2.2. 热点分析
Getis-Ord
指数通过比较广东省各县区范围内要素和广东省内所有要素的差异来识别出疫情的热点区域,广东省在研究时段内的病例热点情况(如图3)。在确诊病例热点地图中,不同时间段识别出不同的热点(高病例聚集)区域,并都通过显著性检验(p < 0.05)。1月26日热点街道分布在珠三角和粤西沿海的20个区县,其中阳江的江城区、阳东区、阳西县表现为热点区域,成为早期疫情较为严重的区域主要是由游客到海陵岛旅游而输入。2月2日热点区域主要集中广州市(8个)、佛山市(4个)、清远市(1个)、中山市(3个)、东莞市(8个),深圳市(7个)。2月9日热点区域基本与2日保持一致,但是广州市黄埔区与南沙区、中山市民众镇、佛山市顺德区、东莞市望牛角墩镇的热点进一步凸显,可信度值由90%增加至95%。2月16日,热点区域增加一个,为东莞市松山湖镇,热点信度为90%;东莞市清溪镇热点信度增高至99%、高埗镇、中堂镇热点信度均增高至95%,广州市海珠区热点信度增加至95%。2月23日东莞市新增一热点区域,为麻涌镇,热点信度值为90%,黄江镇热点信度值增加至95%。3月1日热点区域增加两个,为东莞市常平镇和大朗镇,茶山镇热点信度值上升为95%。
研究表明这个新增热点区域的疫情变得更加严重,区域内病例聚集程度更高,热点信度值增加表明这几个县区的疫情持续恶化,病例感染集中性增强,区域内传播风险增大。空间分布上,热点病例区域主要集中在清远、广州、深圳、佛山、中山、东莞6个城市里,其中深圳和广州的大部分区县都表现为信度值达99%的热点区域。我省不与湖北省邻近,但病例数却仅次于湖北省,其中最重要的输入扩散模式是迁移扩散,主要通过交通运输系统和人口流动进行扩散传染。广州市和深圳市是重要交通运输枢纽和人口集散地,易形成输入病例热点区域,佛山、东莞、中山的人口密度较大、经济发展水平高,这些都有利于疫情进一步在本地传播,也极易形成本地病例的热点区域。
3.3. 疫情空间分布影响因素分析
根据人口流动、经济水平、交通客运和餐饮零售三方面对疫情扩散模式和分布情况的影响,本文主要采用因子分析法对这些因子进行检验分析,然后通过多元线性回归分析病例热点区域与这些因子的关系,最终得出结论。
3.3.1. 因子分析
本文从人口流动、交通客运、经济水平和餐饮零售四方面提取4个变量:人口流动规模、客运量(万人次)、人均GDP(元)和限额以上餐饮业餐费收入(亿元),对这4个变量进行标准化,计算KOM值为0.701,故变量间的相关性较强;进一步计算巴特利特球形检验的近似卡方值为54.305,表明因子间存在较大的线性相关,故可以使用因子分析法进行因子分析。本文提取的4个因子分别解释了原方差的31.245%,30.150%,26.298%和12.307%,累计方差载入为79.1%,概括了原变量的信息。
3.3.2. 多元线性回归
本文利用多元线性回归分析的方法研究广东省各区县确诊病例与人口流动规模、客运量(万人次)、人均GDP (元)和限额以上餐饮业餐费收入(亿元)之间的关系。为了避免零病例对回归分析的影响,本文使用132个县级行政单位作为研究对象。所有区县截止2020年3月1日累计确诊病例数的多元线性回归分析结果(如表2),另外通过分析模型得出决定系数R2大于0.5,说明这几个因子的解释力较高。
经多元线性回归分析发现,确诊病例在空间上的分布与人口流动规模、客运量、人均GDP和限额以上餐饮业餐费收入显著相关。疫情的爆发时间与春节相交,在春运期间的人口流动迅速增大,交通站点人流增多,客运量增大,故客运量因子与人口的流动规模因子给疫情的传播创造了有利机会,疫情风险进一步加大。人均GDP因子也是促进疫情传播的主要因素,当地的经济水平的高低也是影响疫情传播的重要因素,经济水平相对较高的地区,基础设施和人口流动性也较大,如广州市和深圳的下辖区县人均GDP远比其他地方要高,疫情的风险也随即增大。限额以上餐饮业餐饮费收入因子也与疫情传播的关系显著性较大,在疫情期间特别是在春节前夕,人们进行采购年货、聚餐等使在县区范围的短距离内活动增加,宴饮和购物增加了人与人的接触机会,互相传染成为可能,这也成为疫情扩散的重要影响因素。
4. 结论
本文主要从时间和空间两个角度分析广东省疫情的时空聚集特征。在时间上看,广东省的疫情变化主要经历了四个阶段:疫情上升期:1月19日至1月27日;疫情高发期:1月28日至2月8日;疫情下降期:2月9日至2月16日;疫情低水平波动期:2月17日至3月1日。Moran’s I指数由小到大、再到平稳的变化趋势说明了疫情在不同时段的聚集性不同,在前期聚集性较低,后期聚集性较强并保持较高水平的稳定性。
从空间角度看,广东省确诊病例主要分布在广州市、深圳市、中山市的县区。而热点区域主要集中在东莞市(12个)、广州市(8个)、深圳市(7个)、佛山市(4个)、中山市(3个)、清远市(1个),热点区县的分布更能反映出清晰的病例聚集性特征,东莞市的中部县区热点特征不明显,而临近广州市、深圳市的区县热点可信度呈上升趋势,这表明疫情地理邻近的聚集性特征。总体上看,广东省病例的空间分布呈现出与王姣娥 [8] 等的研究相似的临近扩散、等级扩散等特征。
在疫情的空间分布影响因素看,本文主要采用因子分析法对这些因子进行检验分析(KOM值 = 0.701),然后通过多元线性回归分析病例热点区域与这些因子的关系,与地理加权回归分析相比回归系数值更加稳定、分析结果也更加可靠。对广东省确诊的132个县级行政单位进行回归分析,结果表明疫情传播与人口流动规模、客运量、人均GDP和限额以上餐饮业餐费收入显著相关,故也应证了人口流动、交通客运、经济水平和餐饮零售与疫情扩散的相关性。故在以后的疫情防控中应该要减少亲友之间的走访,减少人口的流动,特别是限制中高风险地区的人口流入,避免病毒在区县内与城市间因人口流动而迅速传播。超市、购物中心、市场、餐馆等提供生活物资和生活娱乐的场所与病毒的传播密切相关,这些场所需要进一步做好病毒消杀工作。
广东省是我国重要经济大省也是南方交通运输重要节点,境内与境外的人口流动都十分频繁,特殊的经济地位与交通地位使其暴露在病毒传播的风险之中。本文从县级尺度对广东省的疫情传播时间变化特点与空间分布特点,对广东省以及其他省份的疫情防控精细化具有重要指导性意义。根据本文研究结果,提出以下建议:
1) 从区域上看,不同区域具有不同的疫情来源风险,以广州、深圳、佛山、东莞为中心的珠三角城市是防范外地输入的重要卡点,粤北、粤西、粤东是本地传播的主要风险地,应当做好病毒省内传播防控工作。
2) 在影响因子上,人口流动、餐饮零售、交通出行等方面是病毒传播的重要途径,特别是农村地区需要继续坚持公共交通、超市等人流较大场所的疫情检查工作,防范外地输入以城市间的交通检查为重点,需要适当加强对外来人口和车辆的检查。
本文研究仍然存在一定的局限性,如部分病例信息因位详细公布而剔除会对研究结果造成一定的偏差,使研究的科学性与代表性降低。另外在因子分析的变量选取上还不够深入与精细,使原始变量与病毒传播之间的关系降低,R2值还需要进一步提高。
基金项目
广东省大学生创新创业训练计划项目资助(S202010576052)。