以深圳市茜坑水库5个监测点连续5年的监测资料为基础,选择总磷、水深等环境理化因子,以及藻类生物量、叶绿素a和蓝藻生物量等生物因素,利用SPSS软件,进行多元逐步回归分析,分别研究与生物因素显著相关的环境理化因子。并在此基础上,采用逐步回归统计方法,利用与生物因素显著相关的环境因子,建立了茜坑水库藻类生物量变化的初步预测模式。结果表明,剔除次要环境因子后,水库藻类生物量变化主要受水库的水深,水温及总磷的影响,但不同监测点的显著因子有差异,说明藻类生长因环境不同,限制因子也不同。逐步回归统计模型,能够寻找影响藻类生物量的关键性因子,为准确预测提供参考,但尚不能对藻类爆发性生长做出精确的预测。 Based on five-year monitoring data of Xikeng reservoir in Shenzhen City from 2000 to 2004, data of 11 environment factors (Total phosphorus, water depth, etc.) and 3 biotic factors (algae biomass, Chl-a and blue algae biomass) were employed, and the correlations between these factors were analyzed using multi-statistic method of stepwise based on SPSS. On the basis of the analysis, considering the factors which were significantly related to blue algae biomass, a prediction model of algae biomass was developed. The results showed that algae biomass was mainly affected by water temperature, water depth and total phosphorus concentration. However, the significant factors for different sites were different, which mean the limited factors of algae growth were different in different environment. Multi-statistic method could be helpful to identify key factors but could not supply good prediction results.
杨滢,王艳*,黄文辉,王炜铭
武汉大学资源与环境科学学院,湖北 武汉
收稿日期:2016年1月8日;录用日期:2016年1月26日;发布日期:2016年2月5日
以深圳市茜坑水库5个监测点连续5年的监测资料为基础,选择总磷、水深等环境理化因子,以及藻类生物量、叶绿素a和蓝藻生物量等生物因素,利用SPSS软件,进行多元逐步回归分析,分别研究与生物因素显著相关的环境理化因子。并在此基础上,采用逐步回归统计方法,利用与生物因素显著相关的环境因子,建立了茜坑水库藻类生物量变化的初步预测模式。结果表明,剔除次要环境因子后,水库藻类生物量变化主要受水库的水深,水温及总磷的影响,但不同监测点的显著因子有差异,说明藻类生长因环境不同,限制因子也不同。逐步回归统计模型,能够寻找影响藻类生物量的关键性因子,为准确预测提供参考,但尚不能对藻类爆发性生长做出精确的预测。
关键词 :藻类生物量,多元逐步回归,环境因子,预测
近年来湖泊水库的富营养化问题日益突出,影响人们生产生活及供水安全。学者们针对富营养化机理和预测模式,开展了大量研究工作。富营养化水质模型是研究水质动态变化的有力工具,为富营养化研究提供便捷的方法,为水华的防治提供有力的工具。自20世纪70年代Vollenweider提出了简单总磷模型以来,经过众多科学家的努力,富营养化模型已经得到了很大程度的发展。近年来,富营养化机理性模型中发展较为完善的是生态动力学模型。该类模型涵盖了生态系统中影响藻类生物量的大部分生态学过程,较为完善。国外已有相关模型[
这些生态动力学模型虽然尝试从机理上反映藻类生物量的变化,但涉及的生态学过程复杂,参数众多,对数据量要求大,并且取样频次与取样时间对模型参数测定有较大影响,给模型的参数率定和验证造成了很大困难,且多数主要预测藻类总生物量或叶绿素a,专门针对蓝藻水华的模拟预测模型尚不多见。
而采用逐步多元回归方法,分析环境因子与藻类相关关系,方法简单易行,在实际监测资料的基础上,能较好的明确在特定水体中,环境因子与富营养化藻类的关系,为水华藻类机理模型提供较好的参数分析基础。国内学者们分别在太湖、洪泽湖、千岛湖、淀山湖、巢湖等水体[
深圳市茜坑水库是深圳市重要的饮用水水源地之一,富营养化问题一直是该水库重点防治问题。为了给该水库管理部门防治富营养化提供理论支持,本研究采用该水库连续5年的监测资料,采用逐步回归的统计方法,分析藻类生物量与相关环境理化因子的相关关系,研究对藻类生物量和水华蓝藻生长影响较显著的因子,为水库水华防治工作提供技术参考。同时筛选关键参数,为建立该水库富营养化蓝藻预测模型提供一定的基础。
深圳市茜坑水库是深圳市重要的水源地之一,为全面监控水库的水质状况,该水库管理部门自2000年开始,在水库布设采样点,每月采样1~2次,分析了氨氮、总氮、总磷、溶解氧、透明度等化学指标,以及蓝绿藻及藻类总生物量等生物指标,取得了丰富的监测资料。水库共布设6个监测点,各点位置布设如图1所示。
由于监测点VI为后来设立,数据不连续,所以选用监测点I~V连续5年的监测资料进行分析。选择的环境理化因子包括:引水量、水深、水温、透明度、pH值、化学需氧量(COD)、溶解氧(DO)、氨氮(NH3-N)、总氮(TN)、总磷(TP)等,其中溶解氧包括表层、4m水深处和8m水深处数据。生物因子分析包括叶绿素a、藻类生物量和蓝藻的生物量。
借鉴陈宇炜等[
(1) 采用SPSS软件,对各采样点,以各理化因子为自变量,叶绿素a为因变量,选择临界值95%的显著水平(FC = FJ = 3.0)筛选自变量[
(2) 在上述分析结果基础上,从理化因子中,剔除pH,DO,COD,SD等5项,以剩余6项理化因子为自变量,以藻类总生物量和蓝藻生物量为因变量,采用SPSS分析,分别得到两项生物因子(藻类总生物量和蓝藻生物量)的逐步回归预测方程和复相关系数等。
图1. 监测点位置布设图
(3) 对11项理化因子进行标准化处理,以其标准化值为自变量,以藻类总生物量和蓝藻生物量的标准化值为因变量,采用SPSS分析,得到两项生物因子(藻类总生物量和蓝藻生物量)标准化值的逐步回归预测方程和复相关系数等。
本研究中涉及的环境因子均对藻类的生长有着间接或直接的影响作用。例如,水温对藻类生长有限制作用,氮、磷营养盐通常是藻类生长的限制性因子,透明度和悬浮质的变化会影响水下日光辐射的变化进而影响藻类的生长 [
从上表中可知,蓝藻为水库中的主要的藻类,其与藻类生物量的相关性最大,达0.83。而在理化因子中,藻类生物量与COD的相关性较大,说明在水库中COD对藻类的生长有较大影响。
在本研究中,对DO的分析分别设定了表层DO、4 mDO、4 mDO和DO均值这四个指标。其中,4 mDO与DO均值相关性最大,表明了在水库中,4 mDO的含量最大。而4 mDO与藻类生物量的相关因子达0.57,说明4 mDO是又一影响藻类生长的环境因子。
营养盐的影响:通过大量的研究,人们一致认为,湖泊中的氮、磷等营养物是藻类生长的主要限制性因素。在本研究中,TN和TP和藻类生物量的影响因子分别为0.41和0.38,影响较为密切。
在不同的水体中,环境理化因子对藻类生长的影响程度各不相同。通过多元逐步回归分析,可以筛选出相对重要的影响因子。藻类叶绿素a与理化因子的逐步回归统计结果如表2所示。
由表2可以看出,各个监测点筛选出的重要因子各不相同。
藻类生物量 | 水深 | 透明度 | 表温 | 表层DO | 4 mDO | 8 mDO | pH | NH3-N | T-N | T-P | CODMn | BLUE | green | diatom | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
藻类生物量 | 1 | ||||||||||||||
水深 | 0.51 | 1 | |||||||||||||
透明度 | −0.05 | 0.52 | 1 | ||||||||||||
表温 | 0.34 | 0.36 | −0.39 | 1 | |||||||||||
表层DO | 0.27 | 0.15 | 0.06 | 0.1 | 1 | ||||||||||
4 mDO | −0.57 | −0.53 | 0.2 | −0.81 | −0.12 | 1 | |||||||||
8 mDO | −0.36 | −0.41 | 0.31 | −0.86 | 0.05 | 0.91 | 1 | ||||||||
Ph | 0.41 | 0.14 | −0.12 | 0.32 | 0.42 | −0.18 | −0.14 | 1 | |||||||
NH3-N | 0.2 | 0.26 | −0.44 | 0.74 | 0.3 | −0.59 | −0.6 | 0.35 | 1 | ||||||
T-N | 0.41 | 0.46 | −0.25 | 0.67 | 0.22 | −0.69 | −0.65 | 0.29 | 0.88 | 1 | |||||
T-P | 0.38 | 0.35 | −0.32 | 0.42 | 0.12 | −0.5 | −0.46 | 0.1 | 0.64 | 0.65 | 1 | ||||
CODMn | 0.80 | 0.49 | −0.24 | 0.71 | 0.09 | −0.78 | −0.66 | 0.4 | 0.59 | 0.72 | 0.55 | 1 | |||
蓝藻 | 0.83 | 0.43 | 0.17 | 0.26 | 0.01 | −0.46 | −0.33 | 0.38 | −0.14 | 0.14 | 0.07 | 0.63 | 1 | ||
绿藻 | 0.48 | −0.14 | −0.34 | 0.06 | 0.24 | −0.01 | 0.07 | 0.21 | 0.15 | 0.05 | 0.34 | 0.36 | 0.26 | 1 | |
硅藻 | 0.58 | 0.57 | −0.13 | 0.32 | 0.36 | −0.51 | −0.32 | 0.2 | 0.56 | 0.64 | 0.51 | 0.58 | 0.12 | 0.06 | 1 |
表1. 水库一些理化因子和藻类生物量的线性相关关系
监测点 | 入选变量 | 逐步回归方程 | 复相关系数 | 综合F值 |
---|---|---|---|---|
1 | CODMn | Chla = −0.014 + 0.012 × COD − 0.002 × 引水量 − 0.007 × NH3-N + 0.005 × TN | 0.938 | 29.225 |
引水量 | ||||
NH3-N | ||||
T-N | ||||
2 | CODMn | Chla = −0.04 + 0.15 × COD + 0.004 × DO均值 | 0.934 | 61.021 |
DO均值 | ||||
3 | 表温 | Chla = 0.077 − 0.002 × 表温 | 0.54 | 5.751 |
4 | CODMn | Chla = −0.007 + 0.15 × COD − 0.042 × 透明度 | 0.966 | 63.641 |
透明度 | ||||
5 | CODMn | Chla = −0.01 + 0.005 × COD + 0.004 × 表层DO + 0.003 ×水深 − 0.34 ×透明度 | 0.927 | 24.545 |
表层DO | ||||
水深 | ||||
透明度 |
表2. 叶绿素a与理化因子的逐步回归统计
P1点共有4个因子入选,其中COD和TN为正相关,引水量和NH3-N为负相关。
P2点有COD和DO均值这两个因子入选,且均为正相关。
P3最为特殊,只有表温这个因子影响较为显著。其复相关系数和综合F值均最低,分别为0.54和5.751。
P4有COD和透明度这两个因子入选。其复相关系数和综合F值均最高,分别为0.966和63.641。
而P5有COD、表层DO、水深和透明度这四个因子入选,其中透明度为负相关,其他因子为正相关。
P3点为引水入口附近监测点,受引水影响较大,P1、P2、P4和P5均有COD这个因子入选,而且均为正相关。表明,各个理化因子中,COD对叶绿素a的影响最为显著。
上述分析结果是假设所有理化因子与叶绿素a之间是单向的线性相关,忽略了藻类生长或者大规模爆发,也会影响水体理化因子,如:藻类等光合作用能产氧气,影响水体溶解氧的变化,藻类生长过程中产生的化学物质,也会影响水体中PH的变化,这些环境因子可以说是以藻类为“因”而形成的“果”因素,难以作为自变量用于预测藻类生长 [
因此,要预测藻类生物量尤其是蓝藻生物量的变化,需要剔除溶解氧、pH、SD等因素,用藻类总生物量和蓝藻生物量分别作为因变量,计算逐步回归方程(见表3)。
由表3可见,监测点4无法建立回归方程,监测点1,2,3,5的回归方程分别与水深、TP,表温有关。各个方程的复相关系数相差不大,表明,水深、温度和营养物质对藻类生物量的影响相当。
对蓝藻生物量与环境因子进行回归分析,发现,只有监测点P2能建立回归方程,入选变量为TP,回归方程为:BLUE = −0.016 + 6.187 × TP,复相关系数为0.482,综合F值为6.353。
以监测点P2为例,对藻类生物量和各环境因子进行标准化处理,标准化后的逐步回归方程以TP为显著因子,回归方程为:
点号 | 入选变量 | 逐步回归方程 | 复相关系数 | 综合F值 |
---|---|---|---|---|
1 | 水深 | PHY = −0.051 + 0.170 × 水深 | 0.571 | 10.141 |
2 | TP | PHY = 0.987 + 7.814 × TP | 0.586 | 10.998 |
3 | 表温 | PHY = 5.239 − 0.145 × 表温 | 0.501 | 6.381 |
5 | 水深 | PHY = 0.524 + 0.233 × 水深 | 0.469 | 5.911 |
表3. 藻类生物量与相关环境因子的逐步回归统计结果
Ln(PHY + 1) = 0.659 + 2.518 × Ln (TP + 1)
复相关系数为0.566,与标准化前相近。
同样以监测点P2为例,对蓝藻生物量和各环境因子进行标准化处理,标准化后的逐步回归方程以水深为显著因子,回归方程为:
Ln(PHY + 1) = −1.078 + 0.616 × Ln (Depth + 1)
其中,复相关系数为0.469,显著性较差。与未标准化回归分析相比,未标准化回归方程显著因子为TP,更符合实际情况。
对藻类生物量与环境理化因子的相关性回归分析,结果表明,COD的影响最为显著,但化学需氧量受藻类生长的影响而变化,目前无证据表明COD影响藻类生长,因而难以用于预测藻类生长情况。剔除COD,DO等次要环境因子外,藻类生物量主要受水深,水温及TP的影响。但不同监测点的显著因子不同。表明,藻类生长因环境不同,限制因子也不同。为了建立蓝藻预测模型,对各个因子及藻类生物量进行标准化处理,标准化后的回归方程相对未标准化方程,相关性并无显著改善。
综上所述,逐步回归统计模型,能够寻找影响藻类生物量的关键性因子,为准确预测提供参考,但尚不能对藻类爆发性生长做出精确的预测,要对该水库蓝藻水华进行较准确的模拟预测,还需在分析显著因子的基础上,结合藻类生长机理,建立预测模型。
国家基础科学人才培养基金《武汉大学地理科学理科基地》科研能力训练项目(J1103409);中央高校基本科研业务费专项资金武汉大学自主科研项目(121066)。
杨 滢,王 艳,黄文辉,王炜铭. 深圳某水库水华藻类及相关环境因子逐步回归统计分析 Statistical Regression Analysis of Water-Bloom Algaes and Related Environment Factors of a Reservoir in Shenzhen City[J]. 水资源研究, 2016, 05(01): 33-39. http://dx.doi.org/10.12677/JWRR.2016.51004
http://dx.doi.org/10.1016/S0304-3800(00)00261-1
http://dx.doi.org/10.1016/S0304-3800(97)00184-1
http://dx.doi.org/10.18307/20010110
http://dx.doi.org/10.1016/j.jmarsys.2010.04.003