用MBR系统进行污水处理时,经常会遇到有大量的污泥被截留在膜表面的现象,该现象会造成膜污染,影响MBR系统处理污水的效果,因此我们需要解决的问题就是如何预测MBR系统中的污泥量以便及时清理污泥。为了解决该问题,本文利用基于Haar小波分析改进的多元线性回归算法对MBR系统中的污泥表观产率系数进行预测。通过实验,我们将预测结果与实际系统结果做对比,发现该算法达到了能够准确预测污泥表观产率系数的预期效果,解决了预测MBR系统中污泥量的问题,对提高MBR系统处理污水效果具有一定的价值。 When using the MBR system for wastewater treatment, it is often encountered that a large amount of sludge is trapped on the surface of the membrane. This phenomenon will cause membrane fouling and affect the effect of the MBR system in treating sewage. Therefore, the problem we need to solve is how to predict the MBR. The amount of sludge in the system is used to clean the sludge in time. In order to solve this problem, this paper uses the improved multiple linear regression algorithm based on Haar wavelet analysis to predict the apparent yield coefficient of sludge in MBR system. Through experiments, we compare the predicted results with the actual system results, and find that the algorithm achieves the expected effect of accurately predicting the apparent yield co-efficient of the sludge, solves the problem of predicting the amount of sludge in the MBR system, and improves the processing of the MBR system. The sewage effect has a certain value.
张明1,李春青1,王韬2,王海涛2
1天津工业大学计算机科学与软件学院,天津
2天津工业大学环境与化学工程学院,天津
收稿日期:2018年8月25日;录用日期:2018年9月7日;发布日期:2018年9月14日
用MBR系统进行污水处理时,经常会遇到有大量的污泥被截留在膜表面的现象,该现象会造成膜污染,影响MBR系统处理污水的效果,因此我们需要解决的问题就是如何预测MBR系统中的污泥量以便及时清理污泥。为了解决该问题,本文利用基于Haar小波分析改进的多元线性回归算法对MBR系统中的污泥表观产率系数进行预测。通过实验,我们将预测结果与实际系统结果做对比,发现该算法达到了能够准确预测污泥表观产率系数的预期效果,解决了预测MBR系统中污泥量的问题,对提高MBR系统处理污水效果具有一定的价值。
关键词 :MBR,多元线性回归算法,污泥表观产率系数,Haar小波分析
Copyright © 2018 by authors and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
近年来污水处理成为热点话题之一,污水处理有很多种方法,而利用MBR技术进行污水处理是其中比较高效的方法之一 [
到目前为止,预测MBR系统的模型有很多种,在本文中,我们采用Haar小波分析对多元线性回归算法改进的模型来预测污泥表观产率系数。多元线性回归算法非常适用于做数据预测分析,并且它的泛化能力比较好,但多元线性回归算法存在预测结果误差稍大的问题 [
一元线性回归算法又叫直线拟合算法,一元线性回归算法是研究一个自变量与一个因变量之间相关关系的算法,它是研究两个变量相关关系的最简单模型 [
{ a = x ¯ − b x ¯ b = ∑ i = 1 n x i y i − 1 n ( ∑ i = 1 n x i ) ( ∑ i = 1 n y i ) ∑ i = 1 n x i 2 − 1 n ( ∑ i = 1 n x i ) 2 (1)
在计算出一元线性回归方程后,为了验证所建立一元线性回归方程的正确性,还需要计算误差。在一元线性回归算法中,我们可以利用拟合度的大小来衡量误差的大小,拟合度表示实际数据点在回归直线 y ^ = a + b x 周围的紧凑程度,紧凑程度越大,则误差就会越小,反之则相应的误差就会越大。
多元线性回归算法又叫做重回归算法或复回归算法,它是研究多个自变量与一个因变量之间相关关系的算法 [
y i = β 0 + β 1 x 1 + β 2 x 2 + ⋯ ⋯ + β m − 1 x m − 1 + γ (2)
y ^ = b 0 + b 1 x i , 1 + b 2 x i , 2 + ⋯ ⋯ + b m − 1 x , i , m − 1 i = 1 , 2 , ⋯ ⋯ , n (3)
令 β = ( β 0 , β 1 , β 2 , ⋯ ⋯ , β m − 1 ) T , , ,其中 是未知参数向量, γ 为误差向量;令 Y = ( y 1 , y 2 , ⋯ ⋯ , y n ) T ,X为方程(2)的设计矩阵。把方程(2)写成矩阵的形式: Y = X β + γ ,然后我们要做的就是求解 β ^ 了。同一元线性回归算法一样,利用最小二乘算法来求解向量 β ^ ,经过计算得到 β ^ = ( X T X ) − 1 X T Y 。
在多元线性回归算法中计算误差时,同样可以利用拟合度的大小来衡量误差的大小,在这里我们利用相关系数R的大小来衡量拟合程度,其中 0 ≤ R ≤ 1 。当相关系数R趋向于1时,那么说明算法的拟合度高,相应的误差就越小,反之算法的拟合度低,相应的误差就越大。
在Haar小波分析中,我们假设 V j 是具有形式为 ϕ ( 2 j x − k ) , k ∈ Z , x ∈ R 的所有函数组成的空间, W j 是
具有形式为 ∑ k ∈ Z d k ψ ( 2 j x − k ) , d k ∈ R 的所有函数组成的空间 [
要对信号进行分解来除去噪声,即除去信号中属于 V j + 1 但不属于 V j 的信号,把信号分解为 V j + 1 = V j ⊕ W j
的形式。如此迭代下去得到 V j + 1 = V 0 ⊕ W 0 ⊕ W 1 ⊕ ⋯ ⋯ ⊕ W j ,即
( w j = ∑ k ∈ Z d k j ψ ( 2 j x − k ) ∈ W j , f j = ∑ k ∈ Z c k j ϕ ( 2 j x − k ) ∈ V j ),这样就把信号分解成了若干个分量之和,以便于
对信号去噪,图1更加清晰的描述了Haar小波分解过程 [
Haar小波重构算法是分解算法的逆过程,即 f = f 0 + w 0 + w 1 + ⋯ ⋯ + w j − 1 ,其中 f 0 和 w i 为分量,
f 0 ( x ) = ∑ k ∈ Z c k 0 ϕ ( x − k ) ∈ V 0 , w n ( x ) = ∑ k ∈ Z d k n ψ ( 2 n x − k ) ∈ W n 。图2更加详细地描述了Haar小波重构过程,
图1. Haar小波分解算法示意图
图2. Haar小波重构算法示意图
本文利用Haar小波分解算法与重构算法的特性来对多元线性回归模型进行优化 [
在MBR系统中,我们可以利用污泥表观产率系数 Y o 的大小来衡量系统中的污泥量,影响 Y o 的主要因素有X (微生物浓度),SRT (污泥龄),HRT (水力停留时间), c i − c e (进出水COD浓度差)和 c i − c sup (进水与上清液COD浓度差)。在实验中,为了计算方便我们用 Y o − 1 来表示 Y o 的逆。
我们创建图3所示的模型来预测污泥表观产率系数 Y o 。首先生成1000条样本数据和理论的 Y o − 1 来训练多元线性回归模型( Y o − 1 的计算公式是如公式(4)所示),把这1000条数据组成训练数据集矩阵X和矩阵Y,其中1000条序列 ( X , S R T , H R T , c i − c e , c i − c sup ) 组成的样本数据存放在矩阵X中,1000条 ( Y o − 1 ) 组成的样本数据存放在矩阵Y中,然后利用最小二乘法计算出 β ^ ,最后再计算得出多元线性回归方程,以此来创建图3所示的模型。
Y o − 1 = S R T X [ c i − c e H R T − c i − c sup S R T ] (4)
在实验中,我们选取了某污水处理厂稳定状态下的数据和图3所示的模型来进行测试,把用于测试的实验数据分组,对每组实验数据分别用图3所示的模型来预测污泥表观产率系数并计算拟合度,然后将预测结果和实际系统结果做对比,对比结果如表1和图4所示,观察实验结果表明该模型的精度较高。拟合度情况如图5所示,研究发现该模型计算所得到的拟合度都很接近1,表明该预测模型的拟合度较高。
前面用到的多元线性回归算法需要生成一个训练数据集矩阵X来训练模型,但这样得到的模型在做预测分析时误差稍大,这是因为训练数据集矩阵X中的数据分布不均匀,所以我们要对训练数据集矩阵X做去噪预处理,使数据分布均匀,以此来达到提高模型泛化性和减小误差的目的。
对训练数据集矩阵X去噪有三个步骤,第一步对矩阵X进行Haar小波分解,在这里我们只分解一层就够了;第二步对分解后的各分量数据做阈值量化处理(也就是去噪处理),常用的阈值函数有硬阈值和软阈值函数,这里我选用硬阈值函数(
在实验中,我们首先建立图6所示的模型,然后选取某污水处理厂稳定状态下的数据并利用该模型进行实验。经过实验测得的拟合度情况如图7所示,对比图5我们发现改进后的多元线性回归算法的拟合度都在0.9以上,比改进前的拟合度更高,误差更小,达到了利用Haar小波分析改进的多元线性回归
S R T | H R T | c i − c e | c i − c sup Math_71# | Y o − 1 实际值 | Y o − 1 预测值 | |
---|---|---|---|---|---|---|
2432.8 | 9.4 | 5.2 | 269.6 | 293.3 | 4.9195 | 4.9904 |
2042.1 | 8.5 | 6 | 246.1 | 248.6 | 4.2727 | 4.1097 |
2433.8 | 6.9 | 6.8 | 216.9 | 295.1 | 2.2947 | 2.2890 |
2005.9 | 5.4 | 6.3 | 248.7 | 235.8 | 2.6880 | 2.5248 |
2230.7 | 5.4 | 6.8 | 282.5 | 201.4 | 2.5034 | 2.5350 |
表1. 稳定状态下污泥表观产率系数表(30℃)
图3. 污泥表观产率系数预测模型
图4. 污泥表观产率系数的实际值与测试值关系图
图5. 拟合度测定实验图
图6. 改进后的污泥表观产率系数预测模型
图7. 改进后预测模型的拟合度
算法对污泥表观产率系数做准确预测的目的。
本文讨论了在稳定状态下Haar小波分析改进的多元线性回归算法对污泥表观产率系数的预测,在研究过程中我们分别利用多元线性回归算法和经Haar小波分析改进后的多元线性回归算法来预测污泥表观产率系数。图5所示的实验结果表明多元线性回归算法预测结果的误差并不是很大,但是我们希望误差更小,因此我们在多元线性回归算法中引入Haar小波分析,研究结果表明经Haar小波分析改进后的多元线性回归算法预测结果的精度更高。将该算法应用在MBR膜污染仿真预测中,可以快速准确的预测出污泥表观产率系数,对MBR领域的研究具有一定的理论和实践意义。
国家自然科学基金项目(51378350);国家自然科学基金青年科学基金资助项目(50808130);国家自然科学基金青年科学基金项目(21506159)。
张 明,李春青,王 韬,王海涛. 基于Haar小波分析改进的多元线性回归算法在MBR中的应用 Application of Improved Multivariate Linear Regression Algorithm Based on Haar Wavelet Analysis in MBR[J]. 计算机科学与应用, 2018, 08(09): 1396-1402. https://doi.org/10.12677/CSA.2018.89151