基于2015年四川省PM2.5地面监测数据、MODIS 3 km气溶胶光学厚度(AOD)数据和地面气象站点数据,采用简单线性回归模型、多元线性回归模型、BP神经网络模型、线性混合模型预测近地面PM2.5浓度,并利用地面监测站点数据评估模型的拟合结果。同时利用GIS分析技术,得到四川省2015年空间连续的PM2.5年均、季均浓度分布。结果表明:(1) 利用线性混合模型反演的PM2.5浓度精度最高、效果最好,其可以解释四川省PM2.5浓度75.77%的变异。(2) 线性混合模型预测的PM2.5浓度与地面实测PM2.5浓度在时空变化趋势上基本一致,即东高西低,其中成都平原经济区、川南经济区的PM2.5浓度最大,其次为川东北经济区,最低的为攀西经济区和川西北经济区。PM2.5浓度大小关系为:冬季 > 春季 > 秋季 > 夏季。 Based on the PM2.5ground monitoring data of Sichuan Province, MODIS 3 km aerosol optical depth (AOD) data and surface meteorological station data in 2015, the near surface PM2.5concentration was predicted by simple linear regression model, multiple linear regression model, BP neural network model and linear mixed model, and the fitting results of the model were evaluated by using the ground monitoring station data. At the same time, using GIS analysis technology, the spatial continuous annual and seasonal average concentration distribution of PM2.5in Sichuan Province in 2015 was obtained. The results show that: (1) PM2.5concentration retrieved by linear mixed model has the highest accuracy and the best effect, which can explain 75.77% variation of PM2.5concentration in Sichuan Province. (2) The PM2.5concentration predicted by the linear mixed model is basically consistent with the measured PM2.5concentration on the ground, which is higher in the East and lower in the West. The PM2.5concentration in Chengdu Plain Economic Zone and southern Sichuan Economic Zone is the largest, followed by Northeast Sichuan Economic Zone, and the lowest is Panxi Economic Zone and Northwest Sichuan Economic Zone. The relationship of PM2.5concentration was as follows: winter > spring > autumn > summer.
基于2015年四川省PM2.5地面监测数据、MODIS 3 km气溶胶光学厚度(AOD)数据和地面气象站点数据,采用简单线性回归模型、多元线性回归模型、BP神经网络模型、线性混合模型预测近地面PM2.5浓度,并利用地面监测站点数据评估模型的拟合结果。同时利用GIS分析技术,得到四川省2015年空间连续的PM2.5年均、季均浓度分布。结果表明:(1) 利用线性混合模型反演的PM2.5浓度精度最高、效果最好,其可以解释四川省PM2.5浓度75.77%的变异。(2) 线性混合模型预测的PM2.5浓度与地面实测PM2.5浓度在时空变化趋势上基本一致,即东高西低,其中成都平原经济区、川南经济区的PM2.5浓度最大,其次为川东北经济区,最低的为攀西经济区和川西北经济区。PM2.5浓度大小关系为:冬季 > 春季 > 秋季 > 夏季。
MODIS 3 km AOD,浓度估算,BP神经网络,线性混合模型,时空变化
Lei Wu, Ning Du*, Li Wang, Chunkang Zhang, Xiao Ao
College of Mining, Guizhou University, Guiyang Guizhou
Received: Nov. 2nd, 2020; accepted: Nov. 19th, 2020; published: Nov. 26th, 2020
Based on the PM2.5ground monitoring data of Sichuan Province, MODIS 3 km aerosol optical depth (AOD) data and surface meteorological station data in 2015, the near surface PM2.5concentration was predicted by simple linear regression model, multiple linear regression model, BP neural network model and linear mixed model, and the fitting results of the model were evaluated by using the ground monitoring station data. At the same time, using GIS analysis technology, the spatial continuous annual and seasonal average concentration distribution of PM2.5in Sichuan Province in 2015 was obtained. The results show that: (1) PM2.5concentration retrieved by linear mixed model has the highest accuracy and the best effect, which can explain 75.77% variation of PM2.5concentration in Sichuan Province. (2) The PM2.5concentration predicted by the linear mixed model is basically consistent with the measured PM2.5concentration on the ground, which is higher in the East and lower in the West. The PM2.5concentration in Chengdu Plain Economic Zone and southern Sichuan Economic Zone is the largest, followed by Northeast Sichuan Economic Zone, and the lowest is Panxi Economic Zone and Northwest Sichuan Economic Zone. The relationship of PM2.5concentration was as follows: winter > spring > autumn > summer.
Keywords:MODIS 3 km AOD, Concentration Estimation, BP Neural Network, Linear Mixed Model, Temporal and Spatial Change
Copyright © 2020 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
随着工业和城镇化的快速发展,区域大气污染日益严重,城市空气质量越来越受到人们的关注 [
气溶胶光学厚度(aerosol optical depth, AOD)作为大气气溶胶重要的参数,是表征大气浑浊度或大气气溶胶含量的重要物理量,卫星遥感是目前唯一可提供区域和全球尺度气溶胶特性的探测手段,为大范围遥感监测气溶胶提供了可能 [
目前利用卫星遥感数据估算近地面PM2.5质量浓度的研究主要集中在中东部地区和京津冀地区,对于西南地区相关的研究甚少,且研究主要的遥感数据源为MODIS 10 km AOD产品。已有学者研究表明MODIS 3 km AOD产品与AERONET地基观测的AOD相关性比MODIS 10 km AOD产品的相关性要高 [
本文运用MODIS 3 km AOD产品、气象数据和地面监测站点获取的PM2.5浓度数据建立起适合四川省遥感监测PM2.5浓度的简单线性回归模型、多元线性回归模型、线性混合模型、BP神经网络模型用于估算四川省2015年PM2.5浓度,并用PM2.5地面监测站点数据拟合模型的预测精度,通过对比4种模型反演的PM2.5浓度效果确定最适合遥感监测四川省PM2.5浓度的最佳模型,从而为大气污染治理提供科学依据。
四川省位于中国西南部,地处长江中上游,位于我国大陆地势三大阶梯中的第一级和第二级,全省地貌东西差异大,地形复杂多样,高差悬殊,西高东低的特点明显,介于东经92˚21'~108˚12'和北纬26˚03'~34˚19'之间。东连渝,南邻滇、黔,西接西藏,北界青、甘、陕三省。全省气候类型复杂,区域差异较为显著。东部盆地主要为亚热带湿润气候,西部为高原气候区。东部四川盆地是我国四大盆地之一,其北部为秦岭,东部为米仓山、大巴山,南部为大娄山,西北部为龙门山、邛崃山等山地环绕,阻断了相关气流扰动平原,不利用大气污染物的扩散,且该区域气候温暖湿润,加重了平原地区的污染程度,这导致了四川省是继京津冀、长三角、珠三角地区之后我国第四大灰霾地区 [
本文使用的遥感数据来源于美国NASA网站(http://ladsweb.modaps.eosdis.nasa.gov)公开的MODIS Aqua Level 2级气溶胶产品——MYD04_3K,其空间分辨率为3 km,时间分辨率为1 d,版本为C006。下载四川省2015年1月1日~12月31日时间段内的MYD04_3K AOD产品。通过利用ENVI的MCTK插件对下载的数据进行投影转换、边界剪切等预处理,提取出四川省波段为0.55 um的AOD值用于本文研究。
气象数据来源中国气象网(http://data.cma.cn),获取四川省2015年1月1日~12月31日时间段内各气象站点的风速、温度和相对湿度的日均值。
四川省2015年地面PM2.5浓度数据来源于全国城市空气质量实时发布平台(http://106.37.208.233:20035/)发布的94个监测站点的每小时空气质量数据。图1为四川省94个监测站点的位置分布图。
由于各种数据来源不同,需将AOD、气象数据、地面PM2.5数据做如下处理以便后续建模。MODIS Aqua卫星的过境时间约为下午13:30,选取PM2.5地面监测站点每天下午13:00~14:00的平均PM2.5浓度。在Arcgis10.3中以MODIS AOD数据的分辨率为准,创建四川省范围内3 km × 3 km的格网。根据地面PM2.5监测站点的位置,分别提取各站点对应格网的非空白AOD值,如果有多个地面监测站点位于同一个格网内,则对每个站点的PM2.5浓度取平均值再与AOD值进行匹配。由于获取的气象数据是站点数据为了能与所有地面PM2.5监测站点进行空间匹配,需要对气象数据进行插值处理,以获取研究区域3 km × 3 km分辨率的面状数据,插值方法为普通克里金插值。
图1. 四川省地面PM2.5监测站点分布图
为了建立起适用于四川省卫星遥感估计近地面PM2.5浓度的统计回归模型,本文将从以下几个模型来预测近地面PM2.5浓度。
由于AOD值与地面监测站点的PM2.5浓度具有较好的相关性,因此使用AOD值和地面监测站点PM2.5浓度值建立简单线性模型。该模型的数学表达式如公式(1)所示:
P M 2.5 = α + β A O D (1)
式中,α和β分别为简单线性回归模型的截距和斜率。
根据相关的研究表现:AOD与PM2.5的关系受风速、湿度、温度等气象因子的影响,本文将建立多元线性回归模型来预测地面PM2.5浓度,其数学表达如公式(2)所示:
P M 2.5 = α A O D + b W I N + c R H U + d T E M + e (2)
式中:PM2.5代表平均PM2.5浓度值;WIN为风速值;RHU为相对湿度值;TEM为温度值;e为残差值;α、b、c、d为相应的系数,其残差值和系数由最小二乘法(OLS)确定。
BP神经网络是误差反向传播神经网络的简称,它由一个输入层,一个或多个隐含层和一个输出层构成,每一次由一定数量的神经元构成。它是一个高度复杂的非线性动力学习系统,适合处理多因素、多条件、不精确和模糊的问题 [
线性混合模型包含了固定效应和随机效应,其中固定效应表示影响因子对PM2.5的平均影响状态,而随机效应表示PM2.5与AOD及其他影响因子之间的日差异性,以随机截距和随机斜率的形式表示,本文建立的线性混合模型如公式(3):
P M 2.5 i j = ( a + μ j ) + ( β 1 + b j ) A O D i j + ( β 2 + c j ) W I N i j + ( β 3 + d j ) R H U i j + ( β 4 + e j ) T E M i j + ε i j (3)
式中:PM2.5ij为平均浓度值;α和µj为固定效应和随机效应的截距;AODij表示第i个站点第j天的气溶胶光学厚度值,对应的β1和bj分别表示AOD的固定效应和随机效应的斜率;WINij表示第i个站点第j天的风速值,对应的β2和cj分别表示WINij的固定效应和随机效应的斜率;RHUij表示第i个站点第j天的相对湿度值,对应的β3和dj分别表示RHUij的固定效应和随机效应的斜率;TEMij表示第i个站点第j天的气温值,对应的β4和ej分别表示TEM的固定效应和随机效应的斜率;εij第i个站点第j天的最大误差项,其中线性混合模型的相关参数通过R-language软件计算得到。
本文通过计算地面监测站点实测的PM2.5浓度值与模型预测的PM2.5浓度值之间的R2(决定系数)、RMSE (均方根误差)对模型精度进行验证。决定系数(R2)一般用于回归模型中评估预测值与真实值之间的符合程度,一般地,R2越接近1,说明回归分析中自变量对因变量的解释越好。其计算公式如下(4)
R 2 = ∑ i = 1 n w i ( y ^ i − y ¯ i ) 2 ∑ i = 1 n w i ( y i − y ¯ i ) 2 (4)
式中,n为数据总量i为每个数据的编号; y ^ i 为预测值, y ¯ i 为原始数据均值, w i 为权重。
均方根误差(RMSE)是预测值与真实值偏差的平方与观测参数比值的平方,用来衡量预测值与真实值之间的偏差。其值越小,预测值就越接近真实值,精度就越高,其计算公式如下(5)
R M S E = ∑ i = 1 n ( y o b s , i − y m o d e l i , i ) 2 n (5)
式中,yobs,i为第i个监测格网PM2.5的真实值,单位为:µg/m3;ymodeli,i为第i个监测网格的模型预测值,单位为µg/m3;n为参与建模的总个数。
通过提取四川省94个地面监测站点对应的AOD、风速、相对湿度、气温和PM2.5浓度,最终得到四川省2015年145天的有效数据。各相关参数的描述如表1。由表1可知:2015年四川省全年94个站点的AOD变化范围为0.003~1.521,年均值为0.500,标准差为0.314;PM2.5浓度范围为1.500~232.5,年均值为47.771,标准差为35.238。
皮尔逊相关系数r描述的是两个变量间的相关性强弱,r的绝对值越大,表明相关性越强。为了分析各变量之间的相关性,本文使用SPSS 23统计分析软件对各建模参数进行了Pearson相关性分析(见表2),由表2可知除了风和相对湿度的相关系数r为−0.545以外,其他变量之间的 | r | < 0.2 ,即各变量之间相关性极弱或无相关性,这有效避免了模型多重共线问题。
项目 | 最大值 | 最小值 | 中值 | 平均值 | 标准差 |
---|---|---|---|---|---|
PM2.5/µg/m3 | 232.500 | 1.500 | 39.500 | 47.771 | 35.238 |
AOD | 1.521 | 0.003 | 0.440 | 0.500 | 0.314 |
温度/℃ | 324.481 | −16.178 | 204.790 | 189.150 | 72.045 |
相对湿度/% | 90.115 | 28.103 | 67.620 | 65.983 | 9.962 |
风速/m/s | 2.827 | 0.741 | 1.568 | 1.5711 | 0.350 |
表1. 建模数据各参数的描述性统计分析
参数 | AOD | 相对湿度 | 温度 | 风速 |
---|---|---|---|---|
AOD | 1 | 0.152 | 0.075 | −0.088 |
相对湿度 | 1 | −0.102 | −0.545 | |
温度 | 1 | 0.113 | ||
风速 | 1 |
表2. 模型自变量的Pearson相关性分析
将2015年四川省处理和匹配好的数据分别用于4个模型并进行回归分析,结果如图2所示。
由图2可知:简单线性回归模型可以解释PM2.5浓度33.53%的变异(R2= 0.3353),RMSE为28.613 µg/m3;多元线性回归模型可以解释PM2.5浓度质量48.92%的变异(R2= 0.4892),RMSE为25.187 µg/m3;说明在加入气象数据以后可以提高PM2.5的预测精度,BP神经网络模型可以解释PM2.5浓度60.16%的变异(R2= 0.6016),RMSE为24.109 µg/m3;线性混合模型可以解释PM2.5浓度75.77%的变异(R2= 0.7577),RMSE为17.580 µg/m3。
从斜率与截距方面进行分析可知:4种模型的斜率小于1,截距大于0,说明各个模型都存在一定程度的高估和低估情况。通过线性混合模型和另外的三种模型进行比较发现:线性混合模型的斜率相比其他三种模型分别提高了114.5%、49.82%、24.92%,截距分别降低了57.99%、46.46%、32.98%。
图2. 模型反演结果对比
为了分析PM2.5浓度时空变化规律,进一步将数据划分为春夏秋冬四个季节,本文按3~5月为春节、6~8月为夏季、9~11月为秋季、12~2月为冬季进行划分。各个模型预测的2015年四季平均PM2.5浓度见表3。由表3可知地面监测的PM2.5浓度四季的大小关系为:冬季 > 春季 > 秋季 > 夏季,其大小关系和多元线性回归模型和线性混合模型预测的大小关系一致;而简单线性回归模型预测的PM2.5浓度的大小关系为:春季 > 冬季 > 夏季 > 秋季;BP神经网络模型预测的PM2.5浓度的大小关系为:冬季 > 夏季 > 秋季 > 春季。
模型 | PM2.5浓度(μg∙m−3) | ||||
---|---|---|---|---|---|
春季 | 夏季 | 秋季 | 冬季 | 年均 | |
简单线性回归模型 | 57.62 | 38.79 | 38.07 | 49.43 | 47.25 |
多元线性回归模型 | 51.55 | 28.73 | 42.71 | 69.28 | 47.83 |
BP神经网络模型 | 47.22 | 50.75 | 48.13 | 52.39 | 49.42 |
线性混合模型 | 49.46 | 27.04 | 39.10 | 75.65 | 47.94 |
地面实测PM2.5 | 49.68 | 25.64 | 38.39 | 77.05 | 47.25 |
表3. 4种模型预测的PM2.5浓度季均统计情况
各模型预测的四季平均PM2.5浓度变化趋势见图3,由图3可知:线性混合模型预测的PM2.5浓度季均值变化趋势和地面实测的PM2.5浓度基本一致;BP神经网络和简单线性回归模型预测的夏季和冬季PM2.5浓度和地面监测站预测的PM2.5浓度相差较大。结合各个模型预测的PM2.5浓度的R2和RMSE可知:线性混合模型估算四川省PM2.5质量浓度精最高、效果最好。
由4.2章节可:线性混合模型估算四川省PM2.5质量浓度精最高、效果最好,本文将采用线性混合模型预测的PM2.5浓度进行时空变化分析。为了准确分析四川省2015年PM2.5浓度时空变化,本文将从成都平原经济区、川南经济区、川东北经济区、攀西经济区、川西北经济区的时空变化及影响因子进行分析,具体划分见表4所示。
图3. 各模型预测的 浓度季均值变化趋势
经济区 | 包括的州、市 |
---|---|
成都平原经济区 | 成都市、绵阳市、德阳市、雅安市、眉山市、乐山市、资阳市、遂宁市 |
川东北经济区 | 广元市、巴中市、南充市、达州市、广安市 |
川南经济区 | 内江市、自贡市、宜宾市、泸州市 |
攀西经济区 | 攀枝花市、凉山彝族自治州 |
川西北经济区 | 阿坝藏族羌族自治州、甘孜藏族自治州 |
表4. 四川省经济区划分表
由图4(a)和图4(b)可知,2015年四川省全年平均PM2.5浓度整体呈现东高西低的空间分布趋势,其高值主要出现在成都平原经济区、川东北经济区和川南经济区,其主要原因是此区域的工业发达、汽车尾气和人类生活排放的PM2.5浓度高,加之成都平原经济区和川东北经济区四面环山,不利于PM2.5的扩散。川南经济区地处西南涡旋的中心地带,污染物累积,不易扩散 [
2015年四川省相对湿度、温度、风速的空间分布图分别见图5~图7,结合相对湿度、温度、风速对2015年四川省四个季节的PM2.5浓度进行时空分布分析。由图4(c)可知春季PM2.5浓度主要集中在成都平原经济区的成都、绵阳和德阳,其主要原因是春季该地区的相对湿度较高、温度较低、风速小和降雨量小,这不利于PM2.5的扩散和稀释。
由图4(d)可知成都平原经济区、川东北经济区、川南经济区夏季的PM2.5浓度均值是四个季节中同区域最低的季节。通过对比图5(c)和图5(b)可知夏季成都平原经济区、川东北经济区和川南经济区的相对湿度比春季同区域的相对湿度高,但PM2.5浓度却没有春季高,主要原因是因为夏季的温度、风速都要比春季高,这有利用PM2.5的扩散,其次夏季PM2.5高值区的降雨量占同年降雨量的70%~75%,这有利于PM2.5的稀释。
图4. 2015年四川省PM2.5质量浓度分布图
图5. 2015年相对湿度空间分布图
图6. 2015年温度空间分布图
图7. 2015年风速空间分布图
由图4(e)可知秋季PM2.5高值区主要集中在成都经济区的资阳和遂宁、川南经济区的内江、自贡、宜宾和泸州以及川东北经济区的南充,由图5(d)和图7(d)可知此区域的相对湿度大、风速小,PM2.5浓度扩散速率小,导致了该区域的PM2.5浓度较大。
由图4(f)可知冬季是四个季节中PM2.5浓度最高的季节,PM2.5浓度高值主要分布在成都平原经济区、川东北经济区和川南经济区,主要原因有:冬季PM2.5高值区域的降雨量占年均降雨量的3%~5%,降雨量低不利于PM2.5的稀释;相对湿度高(图5(e))、温度低(图6(e))、风速小(图7(e)),不利于PM2.5的扩散;其次受北方供暖期的影响也增加了该区域PM2.5的浓度。
本文利用MODIS 3 km AOD、气象数据和地面监测实测的PM2.5数据,构建了4种模型来预测PM2.5浓度,并利用最佳预测模型进行PM2.5浓度时空变化分析,其主要结论如下:
(1) 通过计算4种模型预测的PM2.5浓度与地面实测的PM2.5浓度的R2与RMSE,最终确定了线性混合模型预测的PM2.5浓度精度最高、效果最好,其全数据集R2= 0.7577,RMSE = 17.58 µg/m3。
(2) 利用地面预测的PM2.5浓度年均值和线性混合模型预测的PM2.5浓度年均值分别进行空间插值生成2015年四川省年均PM2.5浓度时空分布图,其空间分布格局基本一致,即PM2.5浓度高值区主要分布在成都平原经济区、川东北经济区和川南经济区。通过对线性混合模型预测的PM2.5浓度值按季节进行空间分析发现:2015年四川省PM2.5浓度均值在冬季最高,在夏季PM2.5浓度均值最低。
国家自然科学基金资助项目(41701464);贵州省科技计划项目(黔科合基础[
吴 磊,杜 宁,王 莉,张春亢,敖 逍. 利用遥感数据估算四川省PM2.5的4种模型对比Comparative Analysis of Four Models for Estimating PM2.5in Sichuan Province Using Remote Sensing Data[J]. 应用数学进展, 2020, 09(11): 2063-2074. https://doi.org/10.12677/AAM.2020.911239
https://doi.org/10.1289/ehp.1409481
https://doi.org/10.1038/jes.2015.41
https://doi.org/10.1016/j.rse.2016.05.025
https://doi.org/10.1016/j.rse.2004.05.011