一种适用于水文雨量站降水的质量控制方法
A Quality Control Method Applicable to Precipitation at Hydrological Rainfall Stations
DOI:10.12677/ccrl.2024.135124,PDF,HTML,XML,下载: 7浏览: 36国家科技经费支持
作者:赵莉颍,金素文,温华洋,朱华亮:安徽省气象信息中心,安徽 合肥;陈凤娇:南京气象科技创新研究院,江苏 南京
关键词:水文站降水质量控制方法区域站Hydrological StationsPrecipitationQuality Control MethodsRegional Stations
摘要:利用安徽省2018~2021年1446个水文站小时降水资料,结合站点初筛、数据预处理、界限值检查、时间一致性检查和空间一致性检查等技术,对该站点资料的质量控制方法进行研制。通过与气象站的小时降水资料对比评估,证明该方法在实际监测中的可靠性和有效性。结果显示,经过质控后,水文站和区域站的数据保留率分别为97.05%和97.89%,表明大部分数据具有较高的可用性和可靠性。同时,水文站小时降水资料的质控通过率在不同地形高度和不同季节条件下保持较高水平。其中在重点关注的汛期,水文站和区域站的月降水量变化趋势一致。国家站与临近水文站的降水数据显示出高度一致性,相关系数的最低超过0.70,质控后超过三分之二的站点相关性升高。在2021年7月的强降水事件中,水文站与区域站日降水量空间分布中展现出强降水中心范围和降水量值大值相同。综上所述,为安徽省水文站降水资料所研制的质量控制方法具有适用性和有效性。该方法不仅能够显著提高降水数据的准确性和可靠性,还能够为防汛减灾、水资源管理等工作提供有力的数据支持。对于提高降水预报的准确性和灾害预警能力具有重要意义。
Abstract:Using hourly precipitation data from 1446 hydrological stations in Anhui Province from 2018 - 2021, the quality control method for the data from the stations was developed by combining the techniques of initial screening of the stations, data preprocessing, checking of bounding values, checking of temporal consistency and checking of spatial consistency. The reliability and effectiveness of the method in practical monitoring are demonstrated through comparative assessment with hourly precipitation data from meteorological stations. The results show that, after the quality control, the data retention rates of the hydrological station and the regional station are 97.05 percent and 97.89 percent, respectively, indicating that most of the data have high availability and reliability. Meanwhile, the QC pass rate of hourly precipitation data at hydrological stations remained high under different terrain heights and seasonal conditions. Among them, the trends of monthly precipitation at hydrological stations and regional stations are consistent during the flood season of focus. Precipitation data from national stations and nearby hydrological stations show a high degree of consistency, with the lowest correlation coefficient exceeding 0.70, and more than two-thirds of the stations showing elevated correlations after QC. During the heavy precipitation event in July 2021, the spatial distribution of daily precipitation between the hydrological stations and the regional stations shows the same range of heavy precipitation centers and large values of precipitation. In summary, the quality control method developed for the precipitation data from the hydrological stations in Anhui Province is applicable and effective. The method can not only significantly improve the accuracy and reliability of precipitation data, but also provide strong data support for flood control and disaster reduction, water resource management and other work. It is of great significance to improve the accuracy of precipitation forecasting and disaster warning capability.
文章引用:赵莉颍, 金素文, 温华洋, 朱华亮, 陈凤娇. 一种适用于水文雨量站降水的质量控制方法[J]. 气候变化研究快报, 2024, 13(5): 1078-1088. https://doi.org/10.12677/ccrl.2024.135124

1. 引言

地面降水资料是指通过地面观测站点收集的有关降水现象的各种数据,包括降水量、降水强度、降水时间等信息。作为表征地球表面特定区域内降水现象和水文循环状态的基础数据,地面降水资料对于天气预报、气候预测、重大天气灾害预警以及气象服务和研究具有基础性作用[1][2]。降水资料的质量直接影响天气预报和预测的准确性,从而影响气象服务的水平和质量[3][4]。因此,确保地面降水观测资料的准确性和可靠性至关重要[1][5][6]

为此不少学者开展了降水质量控制方法的研究,Lotte Wilhelmina de Vos等(2019)提出了一种降水资料的质控方法,包括空间一致性检查和界限值检查等,用于检测和删除个人气象站所收集的降水资料中的错误数据,不需要额外的测量,并且可能适用于实时。通过这种方法,阿姆斯特丹一年每小时降雨深度数据的准确性得到了显著提高,同时保留了原始数据集的88%[7]。Shao等(2022)提出了一种质控方法,包括域检查、时空检查和空间检查等,可以自动化地评估和提高第三方气象站观测数据的质量,不仅广泛适用于不同的气象变量,还能处理不同的官方数据源数量[8]。任芝花等(2010)、张强(2016)、闵锦忠(2018)围绕气象部门监测的气象数据开展质量控制方法研究,形成气候界限值检查、时间一致性检查和空间一致性检查等方法,并在业务中进行了应用[9]-[11]。李显风等(2017),宝兴华等(2022)提出气象和水文的降水数据融合应用,将为精细化预报、灾害预警和风险区划提供了更精细、更全面的数据支撑,但前提是完成质量控制,实现监测数据的一致性[12][13]。对水文站的降水质量控制方法的研究上相对较少,偏重于数据的质量评估。如魏爽等(2021)对浙江省23对气象水文邻近站降水资料进行对比评估发现两套观测系统降水在夏季差异最大,当降水量级在0.1~0.5 m时数据的相对误差最大,在大于等于0.5 mm时降水资料高度一致[14]。黄少平等(2020)将江西省气象站和水文站的降水观测数据转换为格点资料,发现两类数据降水量格点场在时空分布上具有较高一致性,在系统性降水过程中两者表现高度相关性,但在零星或者短时降水时两者的相关性差异较大[15]。造成这些差异的原因主要与两者建站目标、仪器性能等存在明显的差异。

本研究提出来一种安徽省水文站小时降水资料的质量控制方法,结合气象部门的降水数据对该方法有效性进行评估,并以此为基础分析水文站和气象站的观测数据在降水特征时间和空间上的差异,旨在为水文数据与气象数据融合应用打下基础,为增强气象预测和预警系统的整体效能,为防灾减灾和水资源管理提供了重要支撑。

2. 资料介绍

2.1. 水文站

水文站数据主要来自安徽省水文局,包括2018~2021年(不含2018年9~12月)共1446个水文站。雨量计监测最小分辨率主要为0.5 mm,个别为0.1 mm,数据传输方面主要采用有降水则传输,无降水则不传输策略,即监测到降水时每10分钟或1个小时上传一次累计降水量数据,其他时间则不传输。本研究主要对最小分辨率为0.5 mm的水文雨量计监测的小时降水数据进行质量控制。

2.2. 气象站

气象站降水数据来自安徽省气象信息中心,包括安徽省81个国家站和2030个区域气象站(简称区域站)的小时降水数据。气象部门雨量计最小分辨率为0.1 mm,有无降水均传输,每10分钟传输一次数据,该数据均通过省级气象资料业务系统(MDOS)进行质量控制。

2.3. 地形数据

ETOPO1全球地形高程数据由美国国家地球物理数据中心(NGDC)提供,集成了全球及区域的地形、测深和海岸线数据,以全面、高分辨率描述地表地球物理特征。数据集采用WGS-84坐标系表示水平基准面,高程基准面以海平面为标准。ETOPO1数据集的地形数据主要来源于NGDC、NASA以及美国冰雪数据中心(NSIDC)。由于水文站未提供站点高度信息,本研究基于其经纬度信息,在ETOPO1数据集中插值得到相应的地形高度。ETOPO1数据集可在其官方网站NGDC-ETOPO1 (https://www.ngdc.noaa.gov/mgg/global/)获取。

3. 质量控制方法与步骤

3.1. 异常站初筛

在数据进行质量控制之前需要先对异常站点进行初筛。对每个站点的年降水量与其10个距离最近的邻近站点的年降水量进行比较,若某站点的年降水量处于邻近站年降水量的0.7至1.3倍之间,且至少有一个邻近站符合此条件,视该站点数据为有效;否则,将该站点从后续质量控制中剔除。通过这一筛选,未通过初筛的水文站有23个,区域站有20个,主要分布在滁州和皖南地区。

3.2. 界限值检查

安徽省的气候学界限值范围设为0至150 mm/h。若降水量超过气候学界限值,并且满足非汛期或重复站点出现的异常极大降水量中标准之一,则判定数据错误。对于不满足条件之一的情况,需进行人工判断,并根据实际情况更新上限值设置参数。水文站的最大记录为138.5 mm/h,区域站有15个站点的132个数据超过150 mm/h。经过两个判别标准的排除,余下4个站点的异常极大降水量需要人工核查(表1),经过人工查询安徽省的相关报道判定数据错误。

Table 1.Regional stations with precipitation exceeding 150 mm

1.降水量超过150 mm的区域站

站点

降水量mm/h

I4188

2021

6

26

18

194.6

I4771

2020

8

11

15

185.8

I5156

2021

8

13

18

160.7

I6784

2018

7

4

22

160.6

3.3. 时间一致性检查

时间一致性检查可分析小时数据连续未变化的情况,以识别由于设备故障、数据传输错误或非典型自然气候条件导致的降水“僵值”。若连续8小时内降水数据无任何变化且无相应气候记录支持,则该数据将被标记为错误。

3.4. 空间一致性检查

经过上述检查之后,对未经检查的数据进行空间一致性检查,以评估数据的空间准确性。包括:

1)连续强降水事件的检查

连续4个时次降水量均在10 mm及以上时,累计这四个时次的降水量,并与相同时段内邻近站点的累积降水量进行比较。若被检站点的累积降水量介于邻近站累积降水量的0.2倍至3.0倍之间,并且至少有两个邻近站符合此标准,则认为该站点数据正确;否则认为该站点数据错误。

2)降水量超过5 mm时的检查

当被检站的单一时次降水量超过5 mm时,与邻近站的相应时次降水量进行比较。如果被检站降水量介于邻近站降水量的0.5倍至2.0倍之间,并且至少两个邻近站满足这一条件,则认为该站点数据正确;否则认为该站点数据可疑。

3)降水量低于5 mm时和可疑数据的检查

对于降水量低于5 mm和可疑的降水数据,进一步与邻近站的当前及前后时次的降水数据进行比较。构建邻近站降水量的序列,并计算序列的最小值及最大值。如果被检站的降水量处于最小值和最大值之间,并且至少两个邻近站符合此标准,则认为该站点数据正确;否则认为该站点数据错误。此外,考虑到降水数据的局地性和持续性,如果被检站在前两个小时或后两个小时的数据显示降水量超过0.5 mm,也视为数据正确。

4. 质量控制结果及分析

4.1. 水文站和区域站降水数据的质量控制效果

2018~2021年安徽省水文站的原始降水数据总量为349.57万条,经质量控制后,有效数据量为339.26万条,未通过质量控制的数据量为10.31万条;区域站的原始数据总量为665.86万条,质量控制后的有效数据量为651.81万条,未通过的数据量为14.05万条。水文站和区域站的数据保留率分别为97.05%和97.89%,说明大部分数据的可用性和可靠性。

表2是水文站和区域站在不同的质控流程中未通过的数据量。界限值检查中,区域站中有132个数据点未通过,占未通过数据总量的0.09%,说明在记录极端降水事件时,部分数据超出了常规气候学界限。时间一致性检查中,水文站和区域站未通过的数据量为5325条和10,237条,分别占未通过数据总量的5.16%和7.29%;表明水文站和区域站均存在数据“僵值”问题。空间一致性检查中,水文站和区域站的未通过数据量分别为97,704条和130,133条,占各自未通过数据总量的94.84%和92.62%。降水数据主要未通过空间一致性检查是主要问题。

Table 2.Volume of data that failed quality control at hydrological stations and regional stations

2.水文站和区域站在质控流程中未通过的数据量统计

检查步骤

水文站数据量

百分比

区域站数据量

百分比

界限值检查

0

0.00%

132

0.09%

时间一致性检查

5325

5.16%

10,237

7.29%

空间一致性检查

97,704

94.84%

130,133

92.62%

数据总量

103,124

/

140,496

/

安徽水文站分布较为均匀,而区域站在安徽南部分布较北部更密集(图1)。水文站和区域站的最低数据质控通过率均超过86%,其中区域站超过98%的站点数量为1252个,占总站点的62.3%,水文站为363个,占比25.5%。通过率较低的站点主要集中在安徽省的中部和南部地区,区域站则主要在北部和中部地区。这种分布可能与地理条件或设备问题有关,未来工作应识别影响这些站点数据质量的具体因素,并针对性地改进质控方法。

Figure 1.Quality control pass rates of hydrological stations (left) and regional stations (right)

1.水文站(左)和区域站(右)的质控通过率

4.2. 不同高度地形下站点数据质量控制效果

为了进一步分析地形高度对降水数据质量控制效果的影响,将站点根据其海拔高度划分为五个等级:0 ≤ H < 200 m、200 ≤ H < 400 m、400 ≤ H < 600 m、600 ≤ H < 800 m,以及800 m以上。表3给出不同高度上水文站和区域站的质控通过率。随着高度的增加,站点数量逐渐减少。在400 m以下,区域站的数量比水文站更为密集,而在更高的高度层级,两者的站点数量大致相同。大部分站点集中在高度0 ≤ H < 200 m的平原地区,此区间内水文站的平均质控通过率和最低正确率分别为97.37%和87.2%,区域站的平均通过率和最低正确率分别为98.02%和86.23%。在较高海拔地形(H ≥ 800 m),数据的最小正确率也保持在92%以上。在所有的高度层级中,区域站的平均正确率普遍高于水文站,但两者在最低正确率上的差异不大。说明两类站点降水数据在不同地形高度上表现出一致性。

Table 3.Quality control pass rates of hydrological and regional stations at different elevation levels

3.不同高度层级下水文站和区域站的质控通过率

H/m

水文站

区域站

平均
正确率%

最大
正确率%

最小
正确率%

站点数

平均
正确率%

最大
正确率%

最小
正确率%

站点数

0~200

97.37

99.52

87.2

1128

98.02

99.77

86.23

1645

200~400

96.76

98.41

89.3

183

97.84

99.4

91

255

400~600

96.22

97.92

91.53

74

97.68

99.37

94.39

74

600~800

95.75

97.41

87.9

26

97.67

98.97

96.39

24

>800

95.28

97.45

92.18

12

96.94

98.32

95

12

4.3. 小时降水数据的质量情况

Figure 2.Total volume and accuracy of hourly precipitation data at different precipitation levels in regional and hydrological stations

2.水文站和区域站小时降水资料中不同降水量的数据总量及其正确率

区域站和水文站的降水量主要集中在0.1~20.0 mm (图2)。降水量小于60 mm的范围内,区域站的正确率高于水文站,在大于60 mm的范围内,水文站的正确率高于区域站。在0.1~0.5 mm范围内,区域站和水文站的错误率相对较高,这可能反映了在小降水量级下,观测和测量的不确定性较大。随着降水值的增加,数据量迅速减少,而错误率却升高,这可能与存在一些明显的异常值和错误数据有关。大部分降水量级中,区域站和水文站的质控正确率均非常高,显示了质量控制方法在大范围内的有效性。在极低和极高降水量段,正确率有所下降,可能需要开发更为精细的质量控制技术,特别是针对极端降水事件和微量降水量。

4.4. 各月降水数据的质量情况

区域站和水文站的降水数据除冬季外的正确率维持在95% (图3)。水文站和区域站的数据正确率呈现明显的季节性变化。冬季的数据正确率最低,汛期(5~8月)的数据正确率最高。冬季数据的正确率最低,可能受到寒冷天气和降水稀缺的影响,这可能导致观测和测量的不确定性增加。水文站和区域站的数据正确率除冬季外变化范围分别为92.07%~97.59%和92.37%~95.68%。水文站的数据正确率普遍高于区域站,表明水文站在数据质量方面表现更为稳定。尽管存在季节性和异常事件下的挑战,但整体而言,质量控制方法有效。未来应对低正确率时段进行详细调查,并考虑在质量控制策略中加入对异常事件的应对措施。

Figure 3.Time series of accurate rate of hourly precipitation data of regional and hydrological stations

3.水文站和区域站小时降水资料的正确率的时间序列图

5. 质量控制方法效果评估

5.1. 与国家站降水量相关性分析

Figure 4.Correlation analysis of precipitation data from 81 national stations with nearby hydrological stations: spatial distribution of correlation coefficients after QC (left) and changes in correlation coefficients before and after QC (right)

4.81个国家站与临近水文站的降水数据相关性分析:质控后的相关系数空间分布(左)和质控前后相关系数的变化(右)

采用81个国家站与邻近水文站的小时降水数据的相关系数变化来评估质控方法的可靠性(图4)。经过质控后,相关系数的范围介于0.70至1.00之间,显示出大多数水文站与国家站间降水数据的高正相关性。相关系数的变化范围从−0.02至0.04,其中潜山站的相关系数最大提升为0.036,天柱山站提升了0.017。站号62915380和58230的相关系数有所下降,原因在于62915380站原始降水量低于58230站,质控后通过剔除零星降水导致数据量减少。相反,62803000站与58415站的相关系数则因质控后剔除了62803000站的大降水量和零星降水而提高,使两站的降水量趋于一致。总体来看,62个站点的相关系数上升,19个站点的相关系数略有下降,这些结果表明质控方法在很大程度上提高了水文站与国家站之间降水数据的一致性。

5.2. 与区域站日降水量对比

(a) (b)

(c) (d)

(e) (f)

(g) (h)

(i) (j)

Figure 5.Daily precipitation amounts at hydrological and regional stations in Anhui during the intense rainfall events of July 2021

5.2021年7月安徽的强降水过程中水文站和区域站日降水量

2021年7月,安徽省经历了多次强降水事件。7月1日,安徽省气象局启动了暴雨四级应急响应。7月2日至5日,合肥迎来了入梅以来的最强降雨。7月8日,安徽省大部分地区出现了阵雨或雷雨,局部地区发生大暴雨,并发布了暴雨黄色预警信号。7月17日,发布了暴雨橙色预警信号。7月25日,安徽省气象台发布了台风蓝色预警信号。图5是水文站和气象站记录的逐日降水量,两者在空间演变特征上表现出相似性。对比这两种站点在2021年7月的四次降水事件中记录的降水量空间分布情况,质控后的数据显示,水文站与区域站观测的日降水量的等级范围基本一致,并能准确显示每次降水过程的降雨中心。特别是在7月2日、7月8日和7月17日的降水中心分别位于安徽的南部、北部和中部。受台风烟花影响的7月27日和28日,降水中心从安徽南部向北部转移。日降水量排名前10位的水文站和区域气象站在雨量级别上相差不大,且其空间分布较为一致。这种数据的高度一致性为将水文站和气象站数据协同用于安徽省降水的预报和预警提供了坚实的基础。

6. 结论

本文建立了一种适用于安徽省本地化的水文站降水质量控制方法,通过对水文站与气象站的降水观测数据进行评估和比较,得到结论如下:

1) 降水数据质量控制方法通过数据检查步骤查找出错误降水数据,主要未通过空间一致性检查。水文站和区域站的数据经过质控后保留率分别达到97.05%和97.89%。

2) 不同高度地形下的站点数据质量控制效果显示,在平原到高山各个高度层级中,尽管站点数量随海拔增加而减少,但质控通过率普遍较高超过86%。

3) 各月降水数据质量显示存在季节性变化,汛期数据正确率较高,而冬季因寒冷和降水稀缺导致正确率降低。

4) 采用国家站与邻近水文站的质控后的小时降水数据相关系数范围在0.70至1.00之间,证明了大多数水文站与国家站间降水数据具有高度正相关性。质量控制方法有效剔除水文站部分错误降水数据。

5) 在安徽省降水过程中,水文站和区域站降水落区和强降水中心分布和逐日的降水演变趋势均一致,为两类资料的融合共同对降水过程预报预警打下基础。

整体而言,通过对安徽省水文站降水数据质量控制和评估对提高该类数据资料准确性提供了重要参考和实践经验,未来的工作将侧重于进一步优化质控流程,尤其是在处理极端天气和季节变化时的质控方法。

基金项目

中国气象局创新发展专项子项课题(项目编号:CXFZ2021Z007)。

参考文献

[1] Liu, S., Li, Y., Pauwels, V.R.N. and Walker, J.P. (2018) Impact of Rain Gauge Quality Control and Interpolation on Streamflow Simulation: An Application to the Warwick Catchment, Australia.FrontiersinEarthScience, 5, Article No. 114.
https://doi.org/10.3389/feart.2017.00114
[2] Tiwari, S., Jha, S.K. and Singh, A. (2020) Quantification of Node Importance in Rain Gauge Network: Influence of Temporal Resolution and Rain Gauge Density.ScientificReports, 10, Article No. 9761.
https://doi.org/10.1038/s41598-020-66363-5
[3] Båserud, L., Lussana, C., Nipen, T.N., Seierstad, I.A., Oram, L. and Aspelien, T. (2020) TITAN Automatic Spatial Quality Control of Meteorological In-Situ Observations.AdvancesinScienceandResearch, 17, 153-163.
https://doi.org/10.5194/asr-17-153-2020
[4] Tedla, H.Z., Haile, A.T., Walker, D.W. and Melesse, A.M. (2022) Evaluation of Factors Affecting the Quality of Citizen Science Rainfall Data in Akaki Catchment, Addis Ababa, Ethiopia.JournalofHydrology, 612, Article 128284.
https://doi.org/10.1016/j.jhydrol.2022.128284
[5] Meira, M.A., Freitas, E.S., Coelho, V.H.R., Tomasella, J., Fowler, H.J., Ramos Filho, G.M.,etal. (2022) Quality Control Procedures for Sub-Hourly Rainfall Data: An Investigation in Different Spatio-Temporal Scales in Brazil.JournalofHydrology, 613, Article 128358.
https://doi.org/10.1016/j.jhydrol.2022.128358
[6] Li, M., Shao, Q., Dabrowski, J.J., Rahman, A., Powell, A., Henderson, B.,etal. (2023) An Automatic Quality Evaluation Procedure for Third-Party Daily Rainfall Observations and Its Application over Australia.StochasticEnvironmentalResearchandRiskAssessment, 37, 2473-2493.
https://doi.org/10.1007/s00477-023-02401-8
[7] de Vos, L.W., Leijnse, H., Overeem, A. and Uijlenhoet, R. (2019) Quality Control for Crowdsourced Personal Weather Stations to Enable Operational Rainfall Monitoring.GeophysicalResearchLetters, 46, 8820-8829.
https://doi.org/10.1029/2019gl083731
[8] Shao, Q., Li, M., Dabrowski, J.J.,et al. (2022) An Operational Framework to Automatically Evaluate the Quality of Weather Observations from Third-Party Stations. arXiv:2212.01998.
https://doi.org/10.48550/arXiv.2212.01998
[9] 任芝花, 赵平, 张强, 等. 适用于全国自动站小时降水资料的质量控制方法[J]. 气象, 2010, 36(7): 123-132.
[10] 张强, 赵煜飞, 范邵华. 中国国家级气象台站小时降水数据集研制[J]. 暴雨灾害, 2016, 35(2): 182-186.
[11] 闵锦忠, 王晨珏, 贾瑞怡. 苏皖地面自动站资料的质量控制及结果分析[J]. 大气科学学报, 2018, 41(5): 637-646.
[12] 李显风, 周自江, 李志鹏, 等. 基于江西省水文资料对中国融合降水产品的质量评估[J]. 气象, 2017, 43(12): 1534-1546.
[13] 宝兴华, 夏茹娣, 罗亚丽, 等. “21∙7”河南特大暴雨气象和水文雨量观测对比[J]. 应用气象学报, 2022, 33(6): 668-681.
[14] 魏爽, 杨明, 吴书成, 等. 浙江省气象与水文站点降水观测资料对比分析[J]. 热带农业科学, 2021, 41(11): 100-106.
[15] 黄少平, 赖亮, 刘海燕, 等. 基于格点场的江西省气象和水文降水资料对比分析[J]. 气象与减灾研究, 2020, 413(2): 130-136.

为你推荐


Baidu
map