1. 引言
全球气候变化的影响评估是当今气候和水文等多个领域研究的热点问题之一,一般依赖于全球气候模式(Global Climate Models, GCMs)提供的气候变量,即将GCMs输出的气候变量与环境响应模型(如:水文模型)相结合,评估环境要素(如:径流)对气候变化的响应。GCMs可以较好地模拟大尺度和季节性的平均气候特征,然而其较低的空间分辨率(100~300 km)使其难以直接与响应模型相结合,估算气候变化对局地或站点尺度环境要素的影响。因此,在开展影响评估之前,需要通过一定的技术手段将大网格尺度的气候变量转化为局地或站点尺度气候变化情景。同时,由于对气候系统理解的局限性,与同一网格尺度观测气象要素相比,GCMs模拟数据具有较大的偏差。为了解决气候模式输出与响应模型输入之间尺度不匹配以及GCMs输出数据存在偏差等问题,降尺度方法得以开发。降尺度是指将大尺度(低时空分辨率)的GCMs输出结果通过动力学或统计学方法转化到小尺度(高时空分辨率)局地或站点气候变化情景的过程(刘昌明等,2012) [1] 。通过时空降尺度产生所期望尺度上高精度的气候变化情景是准确评估气候变化影响的重要环节。
常用的降尺度方法可以分为3大类:动力降尺度、统计降尺度以及动力和统计相结合的降尺度方法。动力降尺度,即区域气候模型(Regional Climate Models, RCMs),是建立在一套大气动力学方程基础之上,基于GCMs提供的初始和侧边界条件,通过动力学方程之间的关系,推导高分辨率的气候变化情景(Dickinson等,1989;Giorgi,1990;Yang等,2010) [2] - [4] 。动力降尺度法具有物理意义明确、不受观测资料影响等特点,可应用不同空间分辨率(一般为15~50 km),能反映影响区域气候的地面特征量及未来气候本身的波动规律,因此近年来得到了广泛的应用。然而由于对气候系统理解的不足和模型本身的局限性,与区域观测气候变量相比,RCM输出变量仍然具有较大偏差,如高估了降水的发生频率、低估了降水极值等(Murphy,1999;Fowler等,2007) [5] [6] 。同时,RCMs的运行基于GCMs所提供的侧边界条件,因此其输出变量在一定程度上遗传了GCMs的偏差。虽然RCMs空间分辨率已得到了很大的提高,仍然不能满足中小流域,特别是站点尺度气候变化的影响评估(Ehret等,2012;Teutschbein和Seibert,2012) [7] [8] 。同时,由于RCMs计算量庞大,只能在部分区域产生有限的气候变化情景,难以满足研究气候变化影响不确定性的需要。
统计降尺度是一种通过建立气候模式输出的历史时段网格尺度气候变量与站点或区域尺度观测的气象要素之间的统计关系,然后将这种关系应用于气候模式输出的未来时段网格数据,从而获得站点或区域尺度未来气候变化情景的方法(陈喜和陈勇勤,2001;范丽军等,2005;Wilby等,2002;Chu等,2010;刘兆飞和徐宗学,2009;刘永和等,2011;成爱芳等,2015) [9] - [15] 。相对于动力降尺度,统计降尺度具有使用简单、计算量较小和精度较高等优点,因此得到了广泛的应用。动力和统计降尺度相结合的方法首先基于GCMs所提供的侧边界条件,通过动力学方程之间的关系,产生区域尺度气候变量,然后在此基础上使用统计降尺度方法产生局地或站点尺度气候变化情景,用于气候变化影响评估,该方法在一定程度上兼顾了动力降尺度和统计降尺度的优点,但实质上仍只是两种方法的简单拼接。本文在总结统计降尺度方法最新研究进展的基础上,分析其发展所面临的问题与挑战,并提出针对各问题的解决思路和方法,以期为统计降尺度的发展指明方向,为气候变化影响评估提供参考。
2. 统计降尺度方法的分类
Xu (1999) [16] 在其综述论文中较早地将统计降尺度方法划分为转换函数法(Wilby等,2002;Chu等,2010;Goyal和Ojha,2011;陈华等,2008;侯雨坤等,2014) [11] [12] [17] - [19] 、环流分型法(Schoof和Pryor,2001;Chen等,2012a) [20] [21] 和随机天气发生器法(Wilks,2010;Zhang,2005;Qian等,2010;Kilsby等,2007) [22] - [25] 。Maraun等(2010a) [26] 在总结统计降尺度方法最新发展成果的基础上,将统计降尺度分为理想预报(PerfectPrognosis, PP)、模型输出统计(Model Output Statistics, MOS)和随机天气发生器(Stochastic Weather Generator, SWG)三种方法。其中PP包括传统的转换函数和环流分型两种方法;而WG与传统方法一致;MOS是气象预报中常用的方法,近年来被广泛用于统计降尺度。以下将基于Maraun等(2010) [26] 分类方法综述各统计降尺度方法的最新研究进展。
2.1. 理想预报(PP)
PP是应用最为广泛的统计降尺度方法,其原理是在历史时段建立网格尺度多个大气环流因子(预报因子,predictor,如:相对湿度和风速等)和站点或区域观测气象要素(预报变量,predictand,如:降水和气温)之间的线性或非线性关系,然后将这种关系应用于未来时段的网格尺度大气环流因子,从而获得站点或区域未来气候变化情景。PP方法一般基于以下三个假设:① GCMs能够很好的模拟网格尺度的大气环流因子;② 大气环流因子与区域或站点尺度气象要素之间具有显著的统计关系;③ 基于历史阶段数据所建立的函数关系可用于未来气候变化时段。预报因子的选择对PP方法的效果具有决定性的作用。选择预报因子是一般要求其具有丰富的预报信息和预报能力,常常通过预报因子与预报变量之间的相关性予以确定。Wilby和Wigley (2000) [27] 归纳了用于降水降尺度的常用预报因子,包括不同位势高度(如:1000,850和500 hPa)的相对湿度、绝对湿度、经向风速、纬向风速、涡度等。
依据预报因子与预报变量之间所建立的函数关系,PP方法可分为线性方法与非线性方法,线性方法即建立预报因子与预报变量间的线性关系。常用的线性方法包括多元线性回归(Multiple linear regression;Chen等2014a) [28] 、典型相关分析(Canonic correlation analysis;Busuioc等,2008) [29] 、主成分分析(Principle component analysis; Wilks, 2005) [30] 、经验正交函数(Empirical orthogonal function;Vimont等,2010) [31] 、奇异值分解(Singular value decomposition;Chu等,2008) [32] 、广义线性模型(Generalized linear model;Maraun等,2010b) [26] 等(刘昌明等,2012) [1] ,其中以多元线性回归应用最为广泛,该方法又包括前进法(forward regression)、后退法(backward regression)、逐步回归(step-wise regression)和直接回归(direct regression)等方法(Goyal和Ojha,2010) [17] 。最常用的统计降尺度模型SDSM (Wilby等,2002a) [11] 其核心就是一种基于多元线性回归的统计降尺度模型。虽然经常把SDSM归纳为转换函数与随机天气发生器(SWG)相结合的方法,但SWG主要是用来对多元线性回归的结果进行偏差校正(bias correction)和方差放大(variance inflation),以此产生气候变化情景集合。多元线性回归法使用简单,然而由于预报因子与预报变量之间时常不具有较强的相关性,该方法往往低估了模拟变量(特别是降水)的方差,也不能准确模拟降水的干湿频率(Chen等,2012a,2014a) [21] [28] 。
由于站点或区域气候变异并不完全取决于大尺度的大气环流因子,使用线性回归往往低估了站点或区域尺度气候变异性,因此往往需要建立大气环流因子与观测气象要素间的非线性关系。常用的非线性方法包括:分类法(Classification method; Wilks, 2005) [30] 、人工神经网络(Artificial Neural Network;Wilby等,1998) [33] 、平滑支持向量机(Smooth Support Vector Machine;Chen等,2010) [34] 等。Xu (1999) [16] 分类中提及的环流分型法属于分类法,是指对与区域气候变化有关的大尺度大气环流因子进行分类,即应用已有的大尺度大气环流因子和局地气候变量的观测资料,对与局地气候变量相关的大气环流因子进行分型;然后计算各环流型频率分布在各气候类型发生的情况下对局地气候变量的权重;最后通过把未来环流型的相对频率加权到局地气候状态,得到未来区域气候变量值(Schoof和Pryor,2001) [20] 。该方法假定未来气候类型不随气候变化而改变,同时由于区域气候类型不一致或不明显,与转换函数相比,该方法并不能有效提高降尺度的精度(Chen等,2012a) [21] 。人工神经网络是应用最为广泛的非线性降尺度方法,而平滑支持向量机是一种与人工神经网络相似的方法。诸多研究表明,与线性法相比,非线性法并不具有明显的优势(如:Wilby等,1998;Chen等,2012a) [21] [34] 。除了线性和非线性方法外,类比法(Analog method; Wilks, 1995) [35] 也是一种重要的降尺度方法,该方法首先基于一定的评估指标(如:Euclidean距离),在历史阶段识别模拟和观测大尺度数据中相似天气状况所对应的局部观测记录,然后在未来天气状况中寻找相似天气状况下所对应的局部天气,该方法只能产生历史阶段已经存在的天气状况,不能生成新的气候事件。
2.2. 模型输出估计(MOS)
虽然GCMs和RCMs输出的降水等气候变量具有明显的偏差,不能满足PP方法要求预报因子“Perfect”的条件,然而GCMs与RCMs输出的降水数据等仍然包含许多有价值的信息,可以直接用于统计降尺度。Wood等(2004) [36] 和Zhang (2005) [23] 等研究表明,使用降水作为唯一的预报因子可以提高对降水的预测能力。通过建立历史时段模拟网格降水与局地或站点观测降水之间的关系,推演未来时段局地或站点降水序列的方法可以称为MOS方法。通过建立模拟气温或其它气象要素与实测气温和与之相对应的气象要素之间的关系,MOS方法也可以用于降尺度气温或其它气象要素。与PP方法建立网格尺度实测预报因子与站点或局地尺度气象要素关系不同的是,MOS方法直接使用GCMs或RCMs输出的气候变量或与之相对应的观测气候变量之间的关系,用以校正输出气候变量的偏差,即常用的偏差校正方法(Ines和Hansen,2006;Sharma等,2007;Christensen等,2008;Mpelasoka和Chiew,2009;Piani等,2010;Themeßl等,2012;Chen等,2013a) [37] - [44] 。该方法将历史观测数据与模型数据在统计参数方面的差异定义为模型偏差,需要在模拟的未来时段气候变量中去除该偏差。
MOS最先被应用于对RCMs模拟的降水和气温进行偏差校正。当模拟变量与观测变量具有相同的空间尺度时,MOS方法仅具有偏差校正的功能;当模拟变量空间尺度大于观测变量空间尺度时,MOS方法还具有降尺度的功能。随着RCMs在气候变化影响评估中的广泛应用,MOS方法取得了快速的发展,一系列方法得以开发并应用于气候变化影响评估中,已逐渐成为使用RCMs评估径流对气候变化响应的标准方法(Teutschbein和Seibert, 2013) [45] ,近年来也逐步被用于对GCMs模拟变量进行降尺度与偏差校正(Chen等,2016) [46] 。
偏差校正法又分为基于均值和基于数学分布校正两种类型。基于均值的方法假设在特定时间尺度上(如:月尺度)所有气候事件具有相同的偏差,采用同一校正因子予以校正。如:Teutschbein和Seibert (2012) [8] 和Chen等(2013b) [44] 采用线性缩放(linear scaling)的方法校正降水量均值的偏差;Schmidli等(2006) [47] 提出的LOCI (local intensity scaling)方法同时校正降水干湿频率和月平均降水量;Chen (2011a) [48] 提出了方差缩放(variance scaling)方法同步校正温度的均值与方差。基于分布的校正则采用不同的因子校正不同的气候事件,最常用的方法为quantile-mapping,该方法校正模拟气候变量的概率分布。如:Themeßl等(2012) [42] 采用quantile-mapping方法校正降水的经验分布,该方法可以基于历史时段内的降水量范围对未来时段的降水事件给予很好地校正,但对历史时段未发生而在未来时段可能发生的极端气候事件难以校正,因为经验分布不具有外延的功能,特别是对于气温来说,随着全球变暖,未来气温分布在历史气温范围之外的可能性增大,因此无法使用基于经验分布的方法予以校正。Themeßl等(2012) [42] 在其研究中假定未来极端降水事件具有与历史最大降水量相同的偏差,而Chen等(2013a) [43] 使用历史时段10个极端降水事件的平均偏差代表未来极端降水事件的偏差,这些基于简单假设的方法均难以保证对极端事件的精确预测。基于概率分布函数(即假定模拟与观测降水量符合一定的概率分布函数)也是常用的偏差校正方法,如最常采用的Gamma分布模拟日降水量(Piani等,2010,Chen等,2013b,Li等,2014) [41] [44] [49] ,采用正态分布模拟日气温(Teutschbein和Seibert,2012;Chen等,2013a) [8] [43] 。使用基于概率分布函数方法时,选择合适的概率分布函数尤为重要,常用的Gamma分布往往低估了降水极值,导致产生的极端响应事件(如:水文极值)具有明显的偏差(Chen和Brissette,2014a,2014b,Li等,2013) [28] [50] [51] 。使用混合分布(如:混合指数分布)能在一定程度上提高降水极值的校正效果。为了避免对降水极端事件的特殊考虑,基于分位数的偏差校正方法时常被应用,该方法假定未来和历史气候事件在各分位数上具有相同的偏差,其中典型的方法为DT (Daily translation)和DBC (Daily bias correction) (Chen等,2013a) [43] ,其中DT被用于降水校正时仅考虑降水量的偏差,而忽略了降水发生频率的偏差,而DBC是DT与LOCI相结合的方法,能同时兼顾降水发生频率与降水量的偏差。
除了MOS偏差校正方法之外,还有一类基于GCMs或RCMs模拟降水的统计降尺度方法—Delta方法。在统计降尺度分类中,Delta方法一般独立归类。为了区别其与偏差校正方法的不同与联系,本文将Delta方法归类于MOS降尺度方法。偏差校正方法将观测和模型数据之间的差异定义为模型偏差,与其不同的是,Delta方法将模拟数据在未来和历史两个不同时段的差异定义为气候变化信号,然后将该信号应用于站点或区域历史观测气象数据序列,便可以获得站点或区域尺度未来气候变化情景。与偏差校正方法相似,Delta方法也可以分为基于均值和基于数学分布两种类型(Mpelasoka和Chiew,2009) [40] 。基于均值的Delta方法应用最为广泛,该方法又称为变换因子(change factor)法,一般在月尺度上计算GCMs或RCMs模拟的平均降水量或气温在未来和历史时段的差异,然后将该差异乘以(降水)或累加(气温)到相同月份历史观测日值数据上。基于分布的方法假定不同的降水或气温等气候事件具有不同的气候变化信号,首先估算模拟数据在概率分布函数或分位数上的气候变化信号,然后将该信号应用于特定时段历史观测数据的概率分布函数或分位数,如最常用的日缩放法(Daily scaling)。当Delta方法被用于降水时,只调整日降水量,而假定降水发生(干湿频率以及干湿日持续天数)在未来时段不发生改变。
2.3. 随机天气发生器(SWG)
SWG是一种根据历史观测气象要素的统计参数采用统计方法产生与历史气象数据具有相同统计特征的随机模拟模型。与历史观测数据往往时段较短且具有缺失值等问题相比,SWG可以产生任意时长、完整的气象数据序列。通过对SWG参数进行空间内插,SWG还可以产生缺测站点或区域的气象要素。SWG最重要的功能是作为时空降尺度工具产生站点尺度或区域平均未来气候变化情景。SWG分为参数与非参数模型两大类,其中以WGEN (Richardson,1981;Richardson和Wright,1984) [52] [53] 为代表的参数模型应用最为广泛。随着SWG应用的深入,多种基于参数的SWG得以发展,如:CLIGEN (Nicks等,1995) [54] 、CLIMGEN (Stockle等,1999) [55] 和WeaGETS (Chen等,2012b) [56] 。这些SWG均采用马尔科夫链模拟降水发生的转移概率,采用概率分布函数模拟日降水量,使用正态分布模拟最高与最低气温;不同点在于基于马尔科夫链的阶数和概率密度函数有所不同。如:WGEN和CLIGEN均基于一阶马尔科夫链模拟降水发生的转移概率,而CLIMGEN基于二阶马尔科夫链,WeaGETS提供了一阶到三阶马尔科夫链三个选项;WGEN、CLIMGEN和CLIGEN分别使用伽玛分布、韦伯分布和偏正态分布模拟日降水量,WeaGETS综合了指数、伽玛、韦伯、偏正态和混合指数等多种分布方法。Chen和Brissette (2014a, 2014b) [28] [50] 综述了多种降水模型并比较了多种SWG对全球不同站点降水和气温模拟的效果,指出一阶马尔科夫链能较好的模拟降水发生,但高阶马尔科夫在模拟最大持续干旱时长时具有一定的优势;同时,指数、伽玛、韦伯分布均可以较好地模拟降水均值,但低估了降水极端事件,而偏正态分布和混合分布能较好的模拟极值降水。
使用SWG对气候模式输出进行统计降尺度时,一般通过调整SWG参数予以实现(Zhang,2005;Wilks,2010;Chen等,2012c) [22] [23] [57] 。SWG参数调整主要有两种方法(Wilks, 2010) [22] 。第一种方法使用大气环流因子的逐日变化调整SWG的参数。如Wilby等(2002b) [11] 最先通过建立大尺度预报因子(北大西洋涛动和海平面气压)与降水参数(降水转移概率和降水均值)之间的函数关系对英国多个站点降雨的高频与低频变异进行降尺度。该方法可以在一定程度上提高降雨的预测精度,然而其结果取决于预报因子与降雨参数之间的相关性,对于所研究的英国大部分站点来说,相关性较弱。第二种方法通过使用GCMs或RCMs提供的特定时段气候变化信号调整SWG的参数(Wilks,2010;Zhang,2005;Qian等,2010;Kilsby等,2007;Chen等,2012c) [22] - [25] [57] 。Wilks (1992) [58] 最先提出使用GCMs模拟的气候变化信号调整降水发生的无条件概率和独立参数对降水发生降尺度,使用模拟的月降水变化量调整概率分布函数(混合指数分布)的参数对降水量降尺度,而气温的降尺度则直接将GCMs模拟的未来和历史阶段的月平均气温差异应用于观测气温数据。Chen等(2012c) [57] 在对降水发生无条件概率、独立参数和条件概率随时间演变研究的基础上,提出使用气候模式输出的降水变化信号调整降水发生的条件概率(转移概率)来实现降水发生的降尺度,而对降水量和温度的降尺度与Wilks方法相似。Wilks (1992) [58] 和Chen等(2012c) [57] 的方法均假设网格尺度的气候变化信号可以代表站点或区域尺度的气象变化信号。而Zhang (2005) [23] 认为使用SWG降尺度时首先需要估算站点或区域尺度的气候变化信号,他提出了基于SWG的两步降尺度方法,该方法首先使用quantile-mapping方法获取站点尺度未来时段月降水量和气温,估算站点尺度气候变化信号;然后使用该信号调整SWG的参数。降水转移概率参数的调整通过建立月降水量与降水转移概率的线性关系予以实现,而降水量与气温参数的调整与Wilks (1992) [58] 方法相似。Chen等(2014b) [50] 在对该方法微调的基础发展了GPCC (Generator for Point Climate Change)模型,并利用全球不同气候区内的多站点降水数据验证了该模型的可靠性(Mullan等,2016) [59] 。
基于单站点SWG的降尺度方法只能产生单一站点或流域平均气候变化情景,仅适用于站点尺度或流域平均气候变化影响评估。而对大流域而言,由于气象要素(特别是降水)具有较大的空间变异性,站点平均数据难以代表整个流域气候变化状况,需要使用具有空间相关特性的多站点气候变化情景驱动分布式流域水文模型评估气候变化对径流的影响(Li,2014;Chen等,2015a) [49] [60] 。通过调整多站点SWG的参数可以产生具有空间相关性的多站点气候变化情景,目前常用的多站点SWG包括:GiST (Baigorria和Jones,2011) [61] 、RMAWGEN (Cordano, 2014) [62] 、TSWG (Li, 2014) [49] 、MulGETS (Chen等, 2014c) [63] ,建立站点间空间相关性依然是多站点SWG的难点,还有待进一步研究。
3. 统计降尺度方法的评估与比较
使用统计降尺度方法进行气候变化影响评估时,需要首先对其在气候情景生成和响应评估中的表现进行评价。降尺度方法的验证一般采用交叉验证法比较降尺度后的气象数据序列与观测数据在统计量方面的差异,即将历史时段气象数据划分为率定期和验证期,在率定期校准降尺度方法,在验证期采用一系列指标评价降尺度方法的表现。选用验证指标需要考虑降尺度方法对气象数据的均值、标准差、分布、极值等方面的模拟表现。对降水进行降尺度时还需要考虑对降水发生的模拟,如:降水干湿频率,干湿日的持续天数,降水转移概率等。国际上已发展了多个针对气象要素和降尺度评估的指标体系,如ETCCDI (Expert Team on Climate Change Detection and Indices),STARDEX和ENSEMBLES评估指标体系,其中特别注重对气象要素极值的评估。基于以上验证指标,采用相对误差、均方根误差,统计检验、泰勒图(Taylor diagram)等评价标准验证降尺度方法的可靠性。
基于各验证指标,研究者们对统计降尺度方法进行了广泛的评价与比较验证,大体上可以分为同类统计降尺度方法的比较、不同类型降尺度方法的比较,统计降尺度与动力降尺度方法的比较。如:侯雨坤等(2014) [19] 比较了基于线性回归(SDSM)和非线性回归(LS-SVM)的两种PP方法对湘江流域降水和气温模拟的可靠性,该研究指出在降水模拟方面LS-SVM与SDSM具有相似的表现,而LS-SVM对气温的模拟效果优于SDSM。Chen等(2013b) [44] 基于再分析数据驱动的RCM,评估了6种MOS偏差校正方法在北美不同气候区流域水文模拟中的表现,该研究指出基于概率分布和分位数的偏差校正方法在降水生成和水文模拟方面均明显优于基于均值的方法。更多研究对比了不同类型的统计降尺度方法在气候情景生成和影响评估中的表现。如:Wilby等(1998) [33] 比较了6中不同类型的统计降尺度方法(两种SWG方法,一种抽样法,一种非线性回归法和两种神经网络法)对降水的模拟精度,结果表明:SWG法表现最佳,但仍然低估了降雨的低频变异,抽样法和非线性回归法表现次之,神经网络方法表现最差。Mullan等(2016) [59] 选用全球不同气候区的10个站点,比较了基于回归的SDSM和基于SWG的GPCC模型在降水生成方面的表现,指出在不同气候区SDSM和GPCC各有优势,但GPCC能更好的降尺度降水发生状态。研究者对动力和统计降尺度也进行了较多的对比,如Schmidli等(2007) [47] 比较了6种统计降尺度方法和3种RCMs在阿尔卑斯山区降水中的表现,并指出统计降尺度和动力学降尺度具有相似的偏差,但在与观测数据相关性方面,两类方法具有明显的差异,在复杂地形区域的冬季,RCM模拟年降水与观测数据具有更高的相关性,而在平坦地区的夏季,两类方法具有相似的表现。Tang等(2016) [64] 选用中国范围内的550个站点比较了统计降尺度模型SDSM与动力降尺度WRF在降尺度气温和和降水方面的表现,指出SDSM可以较好的模拟中国区域内的气温,而WRF低估了大部分区域的气温,SDSM与WRF在降水降尺度精度方面均需进一步地提高。
以上研究表明,不同降尺度方法在不同区域和不同气候条件下具有不同的表现,难以找到一种普适性的降尺度方法。在使用降尺度方法开展气候变化影响评估之前,建议应先验证和比较不同降尺度方法在该特定地区的表现后选择合适的方法。同时,由于缺乏未来观测数据,以上所有降尺度方法的评估与比较均基于历史时段,然而受气候敏感性和气候系统内部变异的影响,在历史阶段率定好的降尺度模型难以保证在未来时段仍然具有同样的表现。Maraun (2012) [65] 和Wang等(2015) [66] 提出使用伪观测的方法验证降尺度方法的可靠性。该方法基于气候模式集合,每次选取一个气候模式作为参考模式(代表观测数据),在历史时段校准降尺度方法,在未来时段验证降尺度方法的可靠性。该方法可以在虚拟数据领域验证降尺度方法在未来气候变化条件下的可靠性,但难以保证各降尺度方法在观测数据领域仍然具有相似的表现。
4. 统计将尺度方法面临的问题与挑战
近年来,针对统计降尺度方法开展了大量的研究,一方面新的方法不断涌现,特别是随着RCMs的发展,统计降尺度已从相对复杂的PP方法逐渐向简单的MOS方法转变,另一方面MOS方法从简单向复杂方向发展,最先的MOS方法仅考虑对气候模式输出变量均值的校正,而最新的方法不仅考虑对均值的偏差校正,还考虑分布、年际变异性、变量间相关性等方面偏差的校正。所有降尺度方法均基于一定的假设,当假设条件不满足时便无法达到预期效果;同时,由于各方法均只考虑了气候模式输出变量某一方面的偏差(具有不同的侧重点),一种方法不可能适用于任何气候变化影响研究。统计降尺度方法的研究与应用还面临着诸多的问题与挑战,以下将综述统计降尺度方法的主要问题与挑战,并提出未来研究思路。
4.1. 预报因子与预报变量间相关性
基于回归的PP降尺度方法,其表现依赖于大气环流因子与站点或区域尺度气象要素之间的相关关系。站点或区域尺度气温与大尺度环流因子间往往具有较高的相关性,因此基于回归方法能较好的降尺度气温。然而站点或区域降水与大气环流因子间相关性较弱,因此该方法往往低估了降水的方差。表现在特定的模型方面,SDSM是统计降尺度模型的代表,在全球不同国家和地区得到了广泛的应用。该模型通过计算大气环流因子与站点降水或气温间的偏相关系数选择合适的预报因子。降尺度气温时,预报因子的方差解释率可以达到80%,而对降水进行降尺度时,方差解释率往往低于40% (Wilby等,2002a) [11] ,导致降尺度后的降水在均值和方差方面都存在较大的偏差。SDSM采用偏差校正和方差放大的方法保证降尺度后降水在率定期与观测数据具有相同的均值和方差。Chen等(2012a, 2014a) [21] [28] 采用方差解释率、均值和标准差的相对误差等验证指标,从GCMs、不同空间分辨率的RCMs和站点等尺度上系统评估了基于线性回归的统计降尺度方法在北美地区的可靠性。研究指出,无论使用GCMs还是不同空间分辨率的RCM的输出变量作为预报因子均不能很好地获得格点和站点尺度的降水序列,但使用RCMs预报因子可以在一定程度上提高降水的模拟精度,并且预报精度随RCMs空间分辨率的提升而提高。当使用NCEP再分析数据作为预报因子降尺度站点降水时,所有站点各季节方差解释率均低于40%,当使用空间分辨率为45 km的RCM输出变量作为预报因子时能略微提高降尺度降水的精度,但方差解释率仍低于50%,提高RCM空间分辨率到15 km能进一步提高降尺度的表现,部分站点冬季降水的方差解释率超过50%。据此,进一步提高RCM的空间分辨率,线性回归统计降尺度的表现有望进一步提高。然而,当RCM空间分辨率达到15 km时,其输出的降水和气温等气象要输可以直接用于驱动水文模型评估气候变化背景下径流的响应,进而越过统计降尺度过程(Arsenault和Brissette,2014) [67] 。同时,PP方法在历史时段使用再分析数据校准统计降尺度模型,然后将校准后的模型用于未来时段GCMs模拟的大气环流因子,但需要注意的是再分析数据与GCMs数据具有不同的来源,前者源于观测数据同化,而后者源于物理属性的模型,通过同化数据率定的降尺度模型难以保证对气候模式输出变量的适用性,这也是PP降尺度方法所面临的问题。
4.2. 气候模型输出变量偏差非一致性
MOS偏差校正方法均基于气候模式输出变量偏差一致性的假设,即气候模式输出变量在历史和未来时段具有相同的偏差。但部分研究想当然的认为气候模式偏差具有一致性。仅有少量研究(Piani等,2010;Terink等,2010;Maraun,2012;Teutschbein和Seibert,2013) [41] [45] [65] [68] 通过评估偏差校正方法在气候变化情景生成中的表现,检验上述假设的合理性。如,Teutschbein 和Seibert (2013) [45] 通过将历史观测数据划分为具有明显差异的两个时段,在第一时段校准偏差校正方法后,通过观测偏差校正方法在第二时段的表现来判断气候模型输出偏差一致性假设,如果偏差校正方法在校准期表现较好,而在验证期表现明显降低,则说明气候模式偏差具有非一致性。该研究使用了6种不同的偏差校正方法,其结果表明,基于分布的方法其表现优于基于均值的方法,但所有方法在验证期的表现均明显下降。Maraun (2012) [65] 使用基于伪观测的方法验证了多个气候模型输出变量偏差一致性的假设性。该方法通过在历史时段选取一个气候模式作为参考模式(代表观测数据),通过偏差校正方法校正其它气候模式输出变量的偏差,在未来时段通过检测偏差校正方法的效果以判断气候模式输出变量偏差在历史和未来两个时段的一致性。研究发现,气候模型输出变量偏差总体具有一致性,但仍然具有区域差异性。
在以上研究的基础上,Chen等(2015b) [69] 提出独立于降尺度过程、直接通过对比网格尺度观测数据与模拟数据偏差验证偏差一致性假设的方法。该方法将长时段的历史观测数据划分为两个时段,在各时段分别计算观测和模式数据统计量的差异,将其定义为模式偏差,通过对比各时段模式输出变量偏差的差异,检验偏差一致性假设,同时比较两历史时段偏差的差异与气候模式预估的未来时段气候变化信号(历史与未来时段的差异)来探讨偏差非一致性对气候变化情景生成的影响。该研究表明:气候模式输出的气温数据基本满足偏差一致性的假设,两历史时段偏差差异显著小于未来气候变化信号;而输出降水的偏差具有非一致性,两个相邻历史时段偏差的差异可以与未来气候变化信号相比拟。作者进一步指出,降水偏差非一致性主要是由于气候内部变异所引起的。在大气运动中,气候是一个典型的非平稳系统,即使没有人为气候变化的影响,气候本身也有变化的趋势,即气候系统的内部变异。因此,评估和验证偏差校正方法表现时需要考虑偏差非一致性的影响。基于此,Chen等(2016) [46] 提出以气候内部变异为基准,评估偏差校正方法在气候变化对径流影响评估中的适用性。该方法将气候模式的偏差(或偏差校正后气候变量残留的偏差)表达为气候内部变异的函数,偏差校正后气候变量所残留的偏差如果在气候内部变异的范围内,则认为偏差校正方法表现较好,残留偏差是由于气候内部变异所引起的,该研究通过气候模式多成员集合估算气候内部变异。通过对比不同复杂程度的偏差校正方法,作者发现复杂的方法在径流响应评估中没有明显的优势,这一改认为复杂方法优于简单方法的传统观念,这主要是由于以往没有考虑气候内部变异的影响。降尺度方法的表现受气候内部变异和气候敏感性的双重影响,目前对气候敏感性的研究较多,由于受观测数据长度和完整性的影响,目前关于气候内部变异对降尺度的影响研究明显不足。随着气候模式的发展,气候模式多成员集合可以较好的模拟气候内部变异(Deser等,2012a,2012b;Risbey等,2014;Mehrotra等,2014;Wuebbles等,2014) [70] - [74] ,在此基础上,建议在对降尺度方法研究中在考虑气候敏感性的同时,进一步考虑气候内部变异的影响。
4.3. 变量间与站点间相关性
降尺度方法往往独立地针对各气候变量,而没有考虑变量间的相关性。如:MOS偏差校正方法均独立地校正各模拟气候变量自身统计量的偏差,而忽略了对变量间相关性的校正。相关研究表明:气候模式输出变量不仅在统计量方面存在偏差,在变量间相关性方面也具有较大的偏差(Chen等2014d;Li等,2014) [49] [75] 。气候变量间相关性对径流模拟具有重要的影响,特别是对以降雪为主导的北方流域和干旱区流域尤为显著,如气温决定降水以何种状态(降雨或降雪)发生和流域冬季积雪的融化(时间和融量);而降水影响土壤含水量,并与温度共同作用于蒸散过程,从而影响流域径流形成(Li等,2014) [49] 。近年来,针对气候模式输出变量间相关性的校正已逐步引起了学者们的重视,少量研究对此进行了初步的尝试,如Piani和Haerter (2012) [76] 采用两维变差法校正降水与气温间的相关性,该方法首先使用quantile-mapping法校正气候模式输出气温的累积分布,然后将降水-气温数据对划分为若干区间,在气温的每一区间校正降水量。Li等(2014) [49] 通过构建降水与气温间的二维联合分布函数校正气候模式输出的月降水量和月平均气温间的相关性。以上方法均局限于两变量间相关性的校正,而径流的形成往往基于多个气候变量,目前尚无对多变量间相关性校正的方法。变量间相关性的建立可以基于以下两种研究思路:① 建立变量间的联合分布函数(如:Copula联合分布函数),该方法在偏差校正方法中首先建立降水、气温等气象要素的多维联合分布函数,然后基于该函数逐步对降水和气温等气象要素进行偏差校正;② 首先采用常规降尺度方法生成独立的多变量气候变化情景,然后依据观测气候变量间的固有相关性,采用统计方法(如:自由分布法)重建变量间的相关性。
常用降尺度方法均只针对于单一站点或流域平均气候变量,而没有考虑各气候变量站点间空间相关性,因此只能产生单一站点或流域平均气候变化情景,难以与分布式水文模型相结合评估气候变化对流域径流影响的空间变异性。特别是基于单站点SWG的统计降尺度方法是在随机数字模型的基础上发展而成,因此其不能产生具有站点间固有相关性的气候变化情景。原则上站点间相关性的建立可以通过以上提到的关于变量间相关性建立的方法(建立站点间多维联合分布函数或采用自由分布法重建站点间相关性)予以实现,然而由于降水数据的非连续性(降水日与非降水日的交叉分布)增加了建立空间相关性的难度,如采用自由分布法重建站点间秩相关可能会改变降水的连续干湿频率。发展基于多站点SWG的统计降尺度方法是同步产生多站点气候变化情景的有效途径之一,该方法首先需要建立多站点SWG。如前所述,目前对多站点SWG已进行了一系列的研究,多个多站点SWG得以开发,如GiST、RMAWGEN、TSWG和MulGETS,其中由Chen等(2014c) [63] 开发的MulGETS是应用最为广泛的多站点SWG之一。该模型是单站点SWG的延伸,即采用时间上独立、空间上相关的多站点随机数序列运行单站点SWG,从而实现站点间相关性的构建。该思想最先由Wilks于1998年提出,但对于降水来说,多站点随机数序列之间的相关性需要高于多站点降水序列的相关性才能使新产生的多站点降水序列具有与观测降水序列相似的相关性,但事先并无法获知多站点随机数序列间相关性要高出多少。Wilks (1998) [33] 采用经验曲线的方法确定多站点随机数序列的相关性,然而该方法计算量庞大,难以在实际中应用。Brissette等(2007) [77] 对该方法进行了改进,采用逐步增大相关系数的优化方法确定随机数序列的相关性,大大提高了运算效率。在此基础上,Chen等(2014c) [63] 进一步改进了降水的生成方法,并增加了多站点温度生成模块,构建了MulGETS模型。使用气候模式模拟的气候变化信号调整MulGETS的参数可以产生多站点气候变化情景。目前对于MulGETS等多站点SWG参数的调整已进行了初步的研究,还有待进一步深入,特别是降水转移概率参数的调整是研究的难点。
4.4. 降尺度方法的不确定性
气候变化的影响评估涉及到多种模型(如:气候模式和水文模型)和多个技术环节(如:时空降尺度)。要完整地分析、描述气候变化的影响,不仅需要量化各模型的不确定性,还需要考虑各技术环节的不确定性。各模型和技术环节的不确定性层层累加最终反映在响应模型(如:水文模型)的输出中,作为决策者最直接的参考依据。气候变化对流域径流影响的不确定性评估是最为广泛的不确定性研究之一。其不确定性来源包括气候模式、温室气体排放情景(GHGES)、降尺度方法和水文模型等。不确定性问题贯穿于气候变化对径流影响评估始终,给研究者和决策者带来了更大的挑战。近年来,气候变化对径流影响的不确定性已引起了广泛关注。若干研究综合考虑了气候变化对流域径流影响的总体不确定性。如:Wilby和Harris (2006) [78] 在评估气候变化对英国Thames流域枯水径流影响时,采用非等权重的方法比较了包括GCMs、GHGES、降尺度方法、水文模型结构和参数在内的5种不确定性来源,该研究指出GCMs和降尺度方法是最大的不确定性来源,而GHGES和水文模型参数对不确定性贡献较小。与之相对应,Chen等(2011b) [79] 以加拿大——北方流域为研究对象,采用等权重概率分析方法,量化了包括GCMs、GHGES、气候内部变异、降尺度方法、水文模型结构和参数在内的6种不确定性来源在气候变化对径流影响评估中的不确定性;该研究总体上认同“气候模式是最大不确定性来源”的观点,但同时也指出其它不确定性来源在特定的水文变量上与气候模式具有相似的不确定性,特别是降尺度方法是仅次于气候模式的最大不确定性来源。
近年来,学者们对降尺度方法在气候变化对径流影响评估中的不确定性也开展了大量的研究(Mpelasoka和Chiew,2009;Chen等,2011a;Ebrahim等,2013;Ouyang等,2014) [40] [48] [80] [81] 。如,Chen等(2011a) [48] 比较了包括动力和统计降尺度在内的6种方法在加拿大北方流域径流影响评估中的不确定性,并与GCMs所引起的不确定性对比,该研究指出降尺度方法与气候模式具有相似大小的不确定性,在径流响应评估中应予以重点考虑,该结论被IPCC第五次评估报告(Cisneros等,2014) [82] 引用。基于单一降尺度方法的径流预测具有较大的风险,使用多方法集合是目前最常用的方法。采用多方法集合估算降尺度方法在气候变化对径流影响评估中所产生的不确定性其关键在于怎样组合各方法进行综合的评判。大多数研究均假设所有降尺度方法具有相同的表现,即给各方法分配相同的权重。缺乏一致的权重确定依据,难以联合多个评价指标也是采用等权重方法的依据(Chen等,2011b) [79] 。然而,另一种观点认为在历史阶段表现较好的降尺度方法在未来时段依然具有较好的表现,应根据其表现分配相应的权重,Wilby和Harris (2006) [78] 在其研究中根据降尺度方法在历史时段的表现分配相应的权重,采用蒙特卡罗法估算降尺度方法的不确定性。但对于是否应该赋予降尺度方法相应的权重以及采用权重法是否可以降低气候变化对径流影响评估中的不确定性,尚无定论。怎样集合多种降尺度方法准确预测流域径流的演变规律并估算降尺度方法对气候变化影响总体不确定性的贡献,特别是这种贡献随时间的演变规律也是亟待研究的科学问题。
5. 结语
随着全球气候变化影响研究的深入,特别是气候变化对流域径流影响评估的发展,统计降尺度方法受到了越来越多的关注,特别是对于RCMs数据较少或缺乏的地区,统计降尺度方法是研究中小流域径流响应不可或缺的技术环节。统计降尺度包含多种技术和方法,各技术方法均具有自身的优势和不足,难以找到一种具有普适性的方法。降水降尺度是发展和应用降尺度方法的难点,PP方法是发展最早、应用最为广泛的方法之一,然而由于降水与大气环流因子之间相关性较弱,该方法往往低估了降水的变异性,同时,PP方法不能满足降水发生(如:降水的干湿频率和降水日持续天数)降尺度的需要。随着RCMs的发展,MOS偏差校正方法逐渐成为使用RCMs进行气候变化影响评估的标准方法,目前已逐步延伸到GCMs的应用中。MOS偏差校正方法均基于气候模式输出变量偏差一致性的假设,然而由于气候系统内部变异的影响,偏差一致性假设常常难以满足,因此,在使用该类方法时需要考虑气候内部变异对偏差校正方法表现的影响。部分偏差校正方法通过调整模拟降水的阈值校正降水发生的频率,即保证在率定期模拟降水与观测降水具有相同的降水干湿频率,然后该方法难以校正降水发生干湿日的持续天数。基于SWG的统计降尺度方法通过马尔科夫链实现对降水发生干湿日持续天数的模拟。然而SWG的不同表现在一定程度上增加了气候变化影响评估的不确定性。
目前,常用的统计降尺度方法均只针对于单一站点或单一变量,而往往忽略了变量间和站点间相关性,为了评估流域或区域尺度气候变化影响的空间变异性,需要同步产生具有变量间相关性的多站点气候变化情景。变量间和站点间空间相关性的构建方法是统计降尺度未来研究的方向之一。统计降尺度方法是气候变化影响评估的重要不确定性来源,基于单一方法的研究已逐步被淘汰,多方法集合仍然是当前考虑的重点。随着对极端气候或水文事件的进一步关注,提高降尺度方法对极端气候事件(特别是极端降水的模拟)、发展针对极端气候事件的降尺度方法,也是未来需要重点研究的方向。同时,怎样充分利用统计和动力降尺度的优点,发展统计和动力降尺度相结合的方法也是未来值得研究的方向。
基金项目
国家自然科学基金重点项目(51539009),青年千人计划武汉大学高层次人才经费。