普通克里金法为一种广泛使用的地理统计的插值方法,但一般都只依据经验使用一个变异函数来计算插值结果。同时,现有研究着重研究年、月尺度下普通克里金法不同变异函数的比较,对日降水尺度研究较少。为了得到普通克里金法在日降水插值适应性较好的变异函数,比较和分析普通克里金法四种常用不同变异函数(指数、球型、高斯、线性)。选取了湘江洣水所在子流域及子流域周边一共43个雨量站1990~2005年逐日降水资料插值,从相关系数、检验指标、不同降水级别准确率这三方面比较插值结果,交叉验证的结果表明:1) 指数和球型函数对普通克里金法的日降水插值适应性较好;2) 普通克里金法的插值结果在降水量大的日子普遍偏小;3) 随着降水量级的增大,日降水插值的误差明显增大。 Ordinary Kriging is a wide-used method of geostatistical interpolation. However, it is only one variogram function that is often used to calculate the estimated value depending on one’s experience. Meanwhile, there is lesser study about daily rainfall comparison of different variogram functions in ordinary Kriging because most of the recent researches emphasize yearly and monthly rainfall. To obtain the better fitted variogram function in ordinary Kriging for daily rainfall interpolation within four different variogram functions (exponential, spherical, gauss, linear). The study leans on 16-year (1990-2005) daily rainfall data at 43 raingages in and around Mishui Basin. According to the comparison of three aspects including the correlation coefficients, examine index, accuracy of different precipitation grade, the result of cross- validation shows that: 1) exponential and spherical functions can fit the daily rainfall interpolation better in ordinary Kriging; 2) the estimated value in ordinary Kriging is generally smaller than observed value on days of heavy rainfall; 3) the error of daily rainfall interpolation increases with the precipitation grade.
汪青静1,许崇育1,2,陈华1
1武汉大学水资源与水电工程科学国家重点实验室,湖北 武汉
2挪威奥斯陆大学地学系,挪威 奥斯陆
收稿日期:2016年10月4日;录用日期:2016年10月23日;发布日期:2016年10月26日
普通克里金法为一种广泛使用的地理统计的插值方法,但一般都只依据经验使用一个变异函数来计算插值结果。同时,现有研究着重研究年、月尺度下普通克里金法不同变异函数的比较,对日降水尺度研究较少。为了得到普通克里金法在日降水插值适应性较好的变异函数,比较和分析普通克里金法四种常用不同变异函数(指数、球型、高斯、线性)。选取了湘江洣水所在子流域及子流域周边一共43个雨量站1990~2005年逐日降水资料插值,从相关系数、检验指标、不同降水级别准确率这三方面比较插值结果,交叉验证的结果表明:1) 指数和球型函数对普通克里金法的日降水插值适应性较好;2) 普通克里金法的插值结果在降水量大的日子普遍偏小;3) 随着降水量级的增大,日降水插值的误差明显增大。
关键词 :普通克里金,变异函数,日降水,空间插值,交叉验证
降水观测值对于气象学、气候学、水文学、地质分析、环境监控都必不可少。降水资料通常是通过已有的雨量站、气象站(包括降水、温度和风速等)收集,因此这些数据都是离散的、局部的和有限的空间点。然而,对于单独的降水站点资料作为径流估计的输入会带来很大的不确定性 [
现有的空间插值方法可以被概括为确定性和地理统计的插值方法 [
由于降水具有间断性和空间不连续性,而且日降水零值较多,因此降水的空间插值与其他要素相比具有更大的困难 [
本文的目的是得到普通克里金日降水插值适应性较好的变异函数。选取了普通克里金插值常用的4种变异函数,设置变异函数参数后计算得估计值,使用交叉验证的思路,对插值结果使用不同的评判方法,比较分析4种变异函数日降水的插值结果,得到适应性较好的变异函数。
普通克里金法是一种经常使用的地理统计的插值方法,而地理统计是一种既考虑样本值又重视样本空间位置及样本之间相关性的方法,通常使用变异函数作为描述空间相关性的核心。
变异函数用来刻画区域化变量在空间中的相关程度,定义为区域化变量在相距为h的任意两点处的平方均值的一半,其计算公式如下:
式中:
根据变异函数的特性,选取适当的半变异理论函数,本文选取的半变异理论函数有常用的四个,分别为球面函数、高斯函数、指数函数、线性函数,其公式如下。
球型函数(Spherical function):
高斯函数(Gauss function):
指数函数(Exponential function):
线性函数(Linearfunction):
在以上四个函数中,
在选择分离距离
受样本数量限制,步长值的选取不宜过小。在每一个分离距离上用来计算样本变异函数的数值一般应大于30个点对 [
普通克里金(Ordinary Kriging)提供了一个在有限区域内对空间变量进行无偏最优估计的方法,是根据样本空间位置不同、样本间相关程度不同,对每个样品赋予了不同的权,进行滑动加权平均,以估计待测点的值。
式中:
而权重是根据克里金插值的无偏估计和方差的最小得到。公式如下:
式中:
交叉验证法(Cross-validation)通过求出检验站点的实测值与估计值之间的误差,作为评价插值方法效果的依据。
本文选用平均误差ME (Mean Error),用来评估插值方法的无偏性,其值越小越好;平均绝对误差MAE (Mean Absolute Error),表示插值结果存在系统误差的大小,其值越小越好;均方根误差RMSE (Root Mean Squared Error)表示插值结果偏离实际值的大小,其值越小越好。
式中:
洣水是湘江的一级支流,本文研究的是洣水所在子流域。该子流域位于北纬26˚1'~27˚23',东经112˚57'~114˚6'之间,整个子流域面积是9929 km2。该子流域高程范围从6~2061 m (图1),东南为山地,高程超过1000 m,其余大都为起伏不平的丘陵与沿河平原。东南部山地主要是变质岩,中部西南部主要为红岩和第四纪松散堆积物。该子流域是亚热带季风气候,年均气温在17℃以上,年均降水为1600 mm,东南降水较大,可达1900 mm以上,西南降水较小,在1400 mm左右,降水从东南向西北递减。全年降水多集中于3~7月,汛期(4~9月)降水占全年的70%左右。
本文的降水数据来源于洣水所在子流域及子流域周边一共43个雨量站(图1)。这些站点具备1990~2005年完整的日降水数据,且空间分布比较均匀。以40个雨量站作为计算站点,以悟田洲站、承坪站、打鸟坳站这3个站点作为交叉验证的检验站点。
在计算变异函数参数时,使用的是洣水所在子流域及周边40个计算站点,其中东江站和清水江站距离最远,为172,561 m,故在进行半方差分析时,选取此距离值的一半(约86,280 m)作为半方差分析的最大步长值。基于以上分析,在对现有数据进行分析时,经过多次步长设置的比较,最终选取步长值为10,785 m,以保证参与计算半方差的点数至少为30,以此获得的步长组数为8。
由于变异函数的使用,克里金插值会产生不好的结果——插值结果小于零。通常,这里有两种方法来避免不好的插值结果:一是通过Deutsh [
图1. 洣水子流域数字高程及站点水系分布图
在对普通克里金插值结果进行评估时,对于所有站点日降水都为零的日子,我们认为在整个流域都是没有降水的,因此不会对这些日子进行插值。本文已有的16年日降水资料中,无雨的日子有983天。
图2给出普通克里金法三个检验站点的4种不同变异函数16年日降水量实测值和估计值结果的对比及其相关系数。从相关系数可以看到,这4种不同变异函数的实测值与估计值均有较高相关性,相关系数在0.8左右。由于所选检验站点的位置不同、所使用插值的已知站点不同,这三个检验站点的相关系数不尽相同,但是对于每一个检验站点的4种不同变异函数相关性的比较,可以看到指数函数的相关性最高,球型函数的相关性次之。其中指数函数和球型函数比较相近,高斯函数和线性函数相关性比较相近。从图中也可以看到,对于每一个检验站点,指数函数和球型函数的估计值在斜率为1的斜线附近较为集中,而高斯函数和线性函数的估计值在斜
图2. 四种不同变异函数日降水实测值与估计值对比图及其相关系数 (a)指数函数;(b)球型函数;(c)高斯函数;(d)线性函数
率为1的斜线附近较为分散,偏离较大,导致相关系数偏低,可以认为使用高斯函数和线性函数插值出现极值误差的几率较大。
本文采用平均误差ME、平均绝对误差MAE和均方根误差RMSE 3个指标来衡量4种不同变异函数的插值效果,其结果如表1。从这三个检验站点的ME来看,高斯函数的误差最大,明显高于指数函数、球型函数、线性函数。从MAE和RMSE来看,指数函数的误差值最小,球型函数的误差次之,但是指数函数和球型函数的误差明显的小于高斯函数和线性函数,说明指数函数的估计值误差范围较小,与实际值更为接近,能更好的适应日降水插值。
由于该地区无降水的日子有983天,将会影响到对较大雨量情况的检验结果,因此对降水量大于等于10 mm的情况,也进行了检验,结果如表2。表2中三个检验站点的ME均小于零,说明这4种不同变异函数的估计值相较于实测值系统的偏小,相比于表1的ME,可以得到降水量大的日子普通克里金插值结果具有一定的减小作用。同时,表2的MAE和RMSE相较于表1均明显增大了很多,说明随着降水量的增大,插值的误差范围也会增大。但随着降水量的增大,指数函数和球型函数的误差范围非常接近,指数函数的误差不再是最小的了,但还是明显的低于高斯函数和线性函数。
以降水量(R) 10,25,50 mm为标准,对大于等于界限的插值结果进行分析。如果实测值大于等于标准值,其插值结果也大于等于标准值,则认为插值准确;如果实测值大于等于标准值,插值结果小于标准值,则认为插值结果不准确。分别统计满足这4种不同变异函数情况下的样本数,然后除以二者的样本数总和,可以得到这4种变异函数所占的比例。
从图3三个检验站点的准确率来看,随着降水量级的增大,指数函数误差最小的优势不再明显,但无论在哪个降水量级,指数函数和球型函数插值结果的准确率非常接近,并且高于高斯函数和线性函数。随着降水量级的增大,插值的准确率有明显较小的趋势。在R ≥ 10 mm (中雨)时,这三个检验站点的准确率在80%左右;在R ≥ 25 mm (大雨)时,准确率在70%左右;在R ≥ 50 mm (暴雨)时,准确率在60%左右。由此可见,在降水量较大的情况,尤其是对暴雨的插值,普通克里金插值的方法不是很好。
站点 | 平均误差ME/mm | 平均绝对误差MAE/mm | 均方根误差RMSE/mm | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
指数 | 球型 | 高斯 | 线性 | 指数 | 球型 | 高斯 | 线性 | 指数 | 球型 | 高斯 | 线性 | |
打鸟坳站 | −0.35 | −0.35 | −0.39 | −0.23 | 1.95 | 1.96 | 2.11 | 2.15 | 25.58 | 25.85 | 31.26 | 39.74 |
悟田洲站 | 0.11 | 0.14 | 0.30 | 0.13 | 1.85 | 1.86 | 2.15 | 2.10 | 24.35 | 24.54 | 34.87 | 31.94 |
承坪站 | 0.08 | 0.08 | 0.17 | 0.15 | 1.43 | 1.45 | 1.58 | 1.60 | 13.76 | 14.34 | 16.58 | 17.18 |
表1. 4种不同变异函数交叉验证检验站点结果
站点 | 平均误差ME/mm | 平均绝对误差MAE/mm | 均方根误差RMSE/mm | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
指数 | 球型 | 高斯 | 线性 | 指数 | 球型 | 高斯 | 线性 | 指数 | 球型 | 高斯 | 线性 | ||
打鸟坳站 | −4.86 | −4.85 | −5.06 | −4.46 | 7.85 | 7.85 | 8.56 | 8.69 | 141.06 | 141.80 | 174.84 | 230.47 | |
悟田洲站 | −2.73 | −2.60 | −2.55 | −2.82 | 6.46 | 6.46 | 7.39 | 7.63 | 123.38 | 123.01 | 181.73 | 169.12 | |
承坪站 | −2.40 | −2.43 | −2.47 | −2.36 | 4.74 | 4.82 | 5.07 | 5.28 | 63.46 | 66.34 | 76.56 | 79.68 | |
表2. 四种不同变异函数交叉验证检验站点结果(日降水量 ≥ 10 mm)
图3. 四种不同变异函数在不同降水级别下的准确率
本文研究了普通克里金法在4种不同变异函数的情况下,对湘江洣水子流域40个雨量站的日降水资料插值,设置变异函数步长值为10,785 m,步长组数为8,从相关系数、检验指标、不同降水级别准确率这三个方面对交叉验证的3个检验站点的插值结果进行比较分析,得出以下结论:
1) 指数和球型函数对于普通克里金日降水插值的适应性较好。指数函数在日降水量级较小时适应性更好;在日降水量级增大时,指数和球型函数对普通克里金插值的适应性均较好。
2) 普通克里金法的插值结果在降水量大的日子普遍偏小。
3) 随着降水量级的增大,日降水的误差明显增大。
国家自然科学基金重点项目(51539009)。
汪青静,许崇育,陈 华. 克里金日降水插值的不同变异函数比较分析 Comparison and Analysis of Different Variogram Functions Models in Kriging Interpolation of Daily Rainfall[J]. 水资源研究, 2016, 05(05): 469-477. http://dx.doi.org/10.12677/JWRR.2016.55054
http://dx.doi.org/10.1016/0022-1694(95)02704-S
http://dx.doi.org/10.1016/S0022-1694(99)00063-3
http://dx.doi.org/10.1016/S0022-1694(96)03250-7
http://dx.doi.org/10.1007/s00376-010-9151-y
http://dx.doi.org/10.5194/hess-15-2259-2011
http://dx.doi.org/10.1016/j.jhydrol.2003.10.008
http://dx.doi.org/10.1016/0098-3004(96)00005-2