针对神经网络网络结构的选择尚无统一而完整的理论指导以及训练样本多样性不足等问题,提出了一种新的基于组合权重-TOPSIS的海水水质评价模型。该模型在权重选取时为了避免主观因素的干扰,分别采用熵权法与CRITIC赋权法计算客观权重,然后利用最小鉴别信息原理计算出组合权重,最后结合TOPSIS方法对胶州湾采集的数据进行实例分析并与其它方法进行对比。实验结果表明,该评价模型能充分利用样本信息,评价结果与相关文献中的结果基本一致,所提模型为海水水质评价提供了一种新的参考。 Aiming at the lack of unified and complete theoretical guidance for the selection of neural network structure and insufficient diversity of training samples, a new seawater quality evaluation model based on combined weight-TOPSIS is proposed. In order to avoid the interference of subjective factors in weight selection, the model uses the entropy weight method and the CRITIC empowerment method to calculate the objective weights, and then uses the principle of least identification information to calculate the combined weights, and finally combines the TOPSIS method to analyze the data collected in Jiaozhou Bay by example and compare with other methods. The experimental results show that the evaluation model can make full use of the sample information, and the evaluation results are basically consistent with the results in the relevant literature, and the proposed model provides a new reference for the evaluation of seawater quality.
针对神经网络网络结构的选择尚无统一而完整的理论指导以及训练样本多样性不足等问题,提出了一种新的基于组合权重-TOPSIS的海水水质评价模型。该模型在权重选取时为了避免主观因素的干扰,分别采用熵权法与CRITIC赋权法计算客观权重,然后利用最小鉴别信息原理计算出组合权重,最后结合TOPSIS方法对胶州湾采集的数据进行实例分析并与其它方法进行对比。实验结果表明,该评价模型能充分利用样本信息,评价结果与相关文献中的结果基本一致,所提模型为海水水质评价提供了一种新的参考。
海水水质,组合权重,综合评价
Yi Wang, Xia Chen, Mengling Guo, Limin Zou*
School of Mathematics and Statistics, Chongqing Technology and Business University, Chongqing
Received: Nov. 10th, 2023; accepted: Mar. 5th, 2024; published: Mar. 13th, 2024
Aiming at the lack of unified and complete theoretical guidance for the selection of neural network structure and insufficient diversity of training samples, a new seawater quality evaluation model based on combined weight-TOPSIS is proposed. In order to avoid the interference of subjective factors in weight selection, the model uses the entropy weight method and the CRITIC empowerment method to calculate the objective weights, and then uses the principle of least identification information to calculate the combined weights, and finally combines the TOPSIS method to analyze the data collected in Jiaozhou Bay by example and compare with other methods. The experimental results show that the evaluation model can make full use of the sample information, and the evaluation results are basically consistent with the results in the relevant literature, and the proposed model provides a new reference for the evaluation of seawater quality.
Keywords:Seawater Quality, Combination Weight, Comprehensive Evaluation
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
海洋是人类开发利用的重要领域之一,随着海水水质日益下降,海水污染日益严重,海洋水质监管和评价越来越受到关注。海水水质评价主要指对海洋环境的监测与评估,可以及时发现海洋环境中的污染物,保护生态系统和人类健康。此外,海水水质评价还可以指导沿海地区的规划和管理。
在水质评价中,针对海水质量的评价方法主要包括模糊聚类法、灰色聚类法、模糊综合评价法、支持向量机、BP神经网络和遗传算法等 [
神经网络实质上实现了一个从输入到输出的映射功能,通用近似定理(universal approximation theorem)指出 [
TOPSIS方法(逼近理想解距离法)常用于多指标评价 [
确立各指标的权重大小一直以来是各综合评价方法的重点,权重大小表明各指标在评价过程当中的重要程度和影响力大小。熵权法计算客观权重的步骤如下:
1) 指标归一化
假设有m个待评价对象,n个评价指标。建立决策矩阵X,矩阵X的每一行表示一个样本,每一列表示一个指标,共含有m行n列,决策矩阵如下:
X = [ x 11 x 12 ⋯ x 1 n x 21 x 22 ⋯ x 2 n ⋮ ⋮ ⋱ ⋮ x m 1 x m 2 ⋯ x m n ] (1)
为了避免不同指标之间数据值差距过大引起的误差,首先对决策矩阵X进行归一化处理得到Y:
Y = [ y 11 y 12 ⋯ y 1 n y 21 y 22 ⋯ y 2 n ⋮ ⋮ ⋱ ⋮ y m 1 y m 2 ⋯ y m n ] (2)
其中第i个数据的第j个指标 y i j = x i j − min i x i j max i x i j − min i x i j 。
2) 计算概率矩阵
对标准化后的每一个指标进行比重转换,第i个数据的第j个指标 P i j 所占比重的计算公式为:
P i j = 1 + y i j ∑ i = 1 m ( 1 + y i j ) (3)
3) 计算每个指标的信息熵
通过概率矩阵计算各指标熵值:
H j = − 1 ln n ∑ i = 1 m P i j ln P i j , i = 1 , 2 , ⋯ , m ; j = 1 , 2 , ⋯ , n . (4)
4) 计算熵权
最后第j个指标的最终权重为:
α j = 1 − H j n − ∑ j = 1 n H j (5)
CRITIC赋权法的主要思想是利用对比强度和冲突性来体现评价对象各指标所蕴含信息量的大小。该方法的主要步骤如下:
1) 指标归一化
CRITIC指标归一化的方式与熵权法一致。
2) 计算指标差异性
CRITIC赋权法各指标差异性以标准差 S j 来体现,即:
S j = 1 m − 1 ∑ i = 1 m ( x i j − x ¯ j ) 2 (6)
其中 x ¯ j 为第j个指标的均值, S j 越大,表明该指标样本之间差距越大,所具有的信息量也就越多,理应分配更多权重。
3) 计算指标冲突性
CRITIC赋权法各指标冲突性 R j 由相关系数得到,即:
R j = ∑ i = 1 m ( 1 − r i j ) (7)
其中 r i j 表示评价指标i和j之间的相关系数。
4) 计算信息量和权重
通过指标差异性 S j 以及冲突性 R j 计算第j个指标的信息量 G j 如下所示:
G j = S j R j (8)
G j 越大,表明第j个指标所蕴含的信息量越大,其权重 β j 如下所得:
β j = G j ∑ j = 1 n G j (9)
客观权重向量 α 和客观权重向量 β 可分别通过熵权法及CRITIC法获得,组合权重则由这两种权重共同构成,利用它们之间的互补性即可全面地体现评价过程中各指标的权重 [
{ min J ( ω ) = ∑ j = 1 m ( ω j ln ω j α j + ω j ln ω j β j ) s .t . ∑ j = 1 m ω j = 1 , ω j ≥ 0 , j = 1 , 2 , ⋯ , m (10)
求解此优化模型,得到组合权重如下所示:
ω j = α j β j ∑ j = 1 n α j β j (11)
组合权重向量为:
ω = [ ω 1 , ω 2 , ⋯ , ω n ] T (12)
本文在模型上选取了多准则决策方法——逼近理想解距离法(TOPSIS),它的基本思想是借助于决策问题的“正理想解”和“负理想解”进行优选排序。该方法的基本步骤如下:
1) 将综合评价矩阵X进行正向化和标准化处理得到Y,对于正向指标,处理方法为:
y i j = x i j ∑ i = 1 m x i j 2 (13)
对于逆向指标,处理方法为:
y i j = max i x i j − x i j ∑ i = 1 m ( max i x i j − x i j ) 2 (14)
结合各指标权重 ω j 和 y i j 求取规范加权矩阵Z,如下所示:
Z = ( z i j ) = ( w j y i j ) m × n , i = 1 , 2 , ⋯ , m ; j = 1 , 2 , ⋯ , n . (15)
2) 选取最优方案与最劣方案。根据各个指标的特征选取在已经规范化后的策矩阵Z中选取最优方案为:
Z ¯ = ( z 1 ¯ , z 2 ¯ , ⋯ , z n ¯ ) ∈ R n (16)
选取最劣方案为:
Z _ = ( z 1 _ , z 2 _ , ⋯ , z n _ ) ∈ R n (17)
3) 计算各个样本与最优方案与最差方案之间的接近程度:
利用欧氏距离来评估每个样本距离最优方案和最劣方案的接近程度。第i个样本与最优方案之间的欧氏距离表示为:
d + = ∑ j = 1 n ( z i j − z ¯ j ) 2 (18)
第i个样本与最劣方案之间的欧氏距离表示为:
d − = ∑ j = 1 n ( z i j − z _ j ) 2 (19)
4) 计算每个样本的综合评价结果。利用以下公式来计算第i个样本的综合评价结果:
c i = d i − d i − + d i + (20)
和文献 [
等级 | 无机氮 | 活性磷酸盐 | COD | 石油类 |
---|---|---|---|---|
I | 0.2 | 0.015 | 2 | 0.05 |
II | 0.3 | 0.03 | 3 | 0.05 |
III | 0.4 | 0.03 | 4 | 0.3 |
IV | 0.5 | 0.045 | 5 | 0.5 |
劣V类 | >0.5 | >0.045 | >5 | >0.5 |
表1. 海水水质标准
注:无机氮、活性磷酸盐、COD、石油类含量单位均为mg/L。
由于本文所选海水指标均为负向指标,所以构造不含有任何污染物的水质样本为最优值,即该样本各指标值全为0。考虑到部分样本超过了最差水质等级劣5类的值,因而构造劣5类水质样本的2倍值为最劣值。最优值和最劣值的固定在一定程度上会降低发生次序反转的概率。最优值与最劣值设置如表2所示:
最值 | 无机氮 | 活性磷酸盐 | COD | 石油类 |
---|---|---|---|---|
最优值 | 0 | 0 | 0 | 0 |
最劣值 | 1 | 0.1 | 10 | 1 |
表2. 最优值与最劣值
选取胶州湾东北部海域的12个监测站的实测数据 [
站位 | 无机氮 | 活性磷酸盐 | COD | 石油类 |
---|---|---|---|---|
1 | 0.336 | 0.001 | 0.48 | 0.07 |
2 | 0.536 | 0.011 | 0.66 | 0.09 |
3 | 0.27 | 0.004 | 1.12 | 0.17 |
4 | 0.243 | 0.011 | 2.96 | 0.12 |
5 | 0.246 | 0.008 | 0.78 | 0.05 |
6 | 0.357 | 0.019 | 0.91 | 0.09 |
7 | 0.321 | 0.019 | 1.28 | 0.13 |
8 | 0.351 | 0.013 | 0.76 | 0.15 |
9 | 0.381 | 0.006 | 0.24 | 0.16 |
10 | 0.403 | 0.007 | 0.32 | 0.11 |
11 | 0.378 | 0.011 | 1.62 | 0.09 |
12 | 0.441 | 0.005 | 0.19 | 0.11 |
表3. 12个监测站的实测数据
将海水质量等级范围、实测数据及正理想解、负理想解形成海水质量综合评价矩阵如下:
X = [ 0 0 0 0 0.2 0.0 15 2 0.0 5 ⋮ ⋮ ⋮ ⋮ 0. 378 0.0 11 1 . 62 0.0 9 0. 441 0.00 5 0. 19 0. 11 ]
对综合评价矩阵进行标准化处理,并采用组合权重组合赋权法求出各指标权重矩阵 W = [ 0 .3081 0 .2202 0 .2804 0 .1913 ] ,求得加权规范矩阵如下:
Z = [ 0 .1103 0 .0542 0 .0789 0 .0507 0 .0882 0 .0533 0 .0631 0 .0490 ⋮ ⋮ ⋮ ⋮ 0 .0686 0 .0536 0 .0661 0 .0477 0 .0616 0 .0539 0 .0774 0 .0470 ]
根据加权规范矩阵,得到各指标与正负理想的距离 d + 、 d − 以及最终相对距离的c如表4所示:
评价等级以及站位 | d + | d − | c |
---|---|---|---|
正理想解 | 0.0000 | 0.1546 | 1.0000 |
等级I界限值 | 0.0272 | 0.1304 | 0.8275 |
等级II界限值 | 0.0407 | 0.1190 | 0.7449 |
等级III界限值 | 0.0552 | 0.1049 | 0.6553 |
等级IV界限值 | 0.0699 | 0.0916 | 0.5672 |
负理想解 | 0.1546 | 0.0000 | 0.0000 |
站位1 | 0.0373 | 0.1275 | 0.7736 |
站位2 | 0.0594 | 0.1148 | 0.6590 |
站位3 | 0.0316 | 0.1277 | 0.8018 |
站位4 | 0.0358 | 0.1229 | 0.7745 |
站位5 | 0.0279 | 0.1322 | 0.8259 |
站位6 | 0.0401 | 0.1235 | 0.7547 |
站位7 | 0.0371 | 0.1237 | 0.7693 |
站位8 | 0.0395 | 0.1240 | 0.7584 |
站位9 | 0.0424 | 0.1246 | 0.7462 |
站位10 | 0.0447 | 0.1235 | 0.7345 |
站位11 | 0.0437 | 0.1192 | 0.7317 |
站位12 | 0.0488 | 0.1221 | 0.7144 |
表4. 计算结果
利用表的量化结果,就能得出各站位对应的水质评价等级。将本文评价结果与模糊综合评价、BP神经网络评价以及文献 [
模糊综合评价 | BP神经网络 | 文献 [
|
本文结果 | |
---|---|---|---|---|
站位1 | I | III | II | II |
站位2 | IV | III | III | III |
站位3 | I | II | II | II |
站位4 | II | II | II | II |
站位5 | I | II | II | II |
站位6 | II | II | II | II |
站位7 | II | II | II | II |
站位8 | II | II | II | II |
站位9 | II | II | II | II |
站位10 | III | III | III | III |
站位11 | III | III | II | III |
站位12 | III | III | III | III |
表5. 评价结果对比
分析比较实验结果,模糊综合评价法在站位1、站位2、站位3、站位5的评价结果不够客观准确,导致其结果的主要原因为权重的计算方式不当,其客观权重的计算没有考虑数据量纲的影响,即认为数据越大的指标信息量越大,当某种指标非常小甚至为0时,其权重就变得非常小,即认为对评价结果几乎没有影响。BP神经网络相较于其他文献,在站位1处的评价结果较差,其原因极有可能是陷入局部极小。而文献 [
为了进一步说明结果的可信度和模型的实际应用价值,接下来对模型的敏感性进行分析,模型的敏感性分析采用增加和减少样本的个数,观察原有样本的水质评价等级是否具有较为明显的变动来体现。具体实施方法为,在本文所选12个站位的样本基础上,依次逐个减少站位1、站位2、站位3的样本,记录每次减少样本后剩余样本的水质等级是否发生较大改变。减少样本的对应分析结果如表6所示:
评价等级以及站位 | 减少站位1的分数 | 减少站位1、2的分数 | 减少站位1、2、3的分数 | 对应等级 |
---|---|---|---|---|
正理想解 | 1.0000 | 1.0000 | 1.0000 | |
等级I界限值 | 0.8276 | 0.8302 | 0.8298 | |
等级II界限值 | 0.7450 | 0.7491 | 0.7484 | |
等级III界限值 | 0.6554 | 0.6608 | 0.6601 | |
等级IV界限值 | 0.5673 | 0.5740 | 0.5734 | |
负理想解 | 0.0000 | 0.0000 | 0.0000 | |
站位1 | II | |||
站位2 | 0.6599 | III | ||
站位3 | 0.8022 | 0.8104 | II | |
站位4 | 0.7745 | 0.7758 | 0.7753 | II |
站位5 | 0.8263 | 0.8346 | 0.8342 | II |
站位6 | 0.7553 | 0.7675 | 0.7669 | II |
站位7 | 0.7698 | 0.7798 | 0.7794 | II |
站位8 | 0.7590 | 0.7710 | 0.7706 | II |
站位9 | 0.7468 | 0.7605 | 0.7600 | II |
站位10 | 0.7352 | 0.7476 | 0.7460 | III |
站位11 | 0.7323 | 0.7439 | 0.7433 | III |
站位12 | 0.7152 | 0.7309 | 0.7304 | III |
表6. 减少样本的结果分析
同理,逐步在正负理想解范围内随机生成3个样本,记录每次增加样本对原有样本的水质等级造成的影响。增加随机样本的分析结果如表7所示:
评价等级以及站位 | 增加随机站位1的分数 | 增加随机站位1、2的分数 | 增加随机站位1、2、3的分数 | 对应等级 |
---|---|---|---|---|
正理想解 | 1.0000 | 1.0000 | 1.0000 | |
等级I界限值 | 0.8273 | 0.8273 | 0.8273 | |
等级II界限值 | 0.7445 | 0.7446 | 0.7446 | |
等级III界限值 | 0.6548 | 0.6546 | 0.6546 | |
等级IV界限值 | 0.5665 | 0.5659 | 0.5660 | |
负理想解 | 0.0000 | 0.0000 | 0.0000 | |
增加随机站位1 | 0.7849 | 0.7849 | 0.7850 | II |
增加随机站位2 | 0.7039 | 0.7039 | III | |
增加随机站位3 | 0.8688 | I | ||
站位1 | 0.7756 | 0.7799 | 0.7790 | II |
站位2 | 0.6620 | 0.6687 | 0.6673 | III |
站位3 | 0.8030 | 0.8056 | 0.8051 | II |
站位4 | 0.7736 | 0.7725 | 0.7728 | II |
站位5 | 0.8272 | 0.8300 | 0.8294 | II |
站位6 | 0.7566 | 0.7609 | 0.7600 | II |
站位7 | 0.7708 | 0.7741 | 0.7734 | II |
站位8 | 0.7603 | 0.7646 | 0.7637 | II |
站位9 | 0.7485 | 0.7535 | 0.7524 | II |
站位10 | 0.7369 | 0.7421 | 0.7410 | III |
站位11 | 0.7333 | 0.7370 | 0.7363 | III |
站位12 | 0.7171 | 0.7229 | 0.7217 | III |
表7. 增加随机样本的结果分析
根据以上实验结果显示,原样本水质等级结果均未发生改变,说明该模型在样本发生改变时预测结果依然可靠,具有较好的稳定性。
1) 本文将熵权和CRITIC赋权法相结合,得到一种客观组合权重计算方法。组合权重法同时兼顾海水指标的差异性和关联性,得到的权重更加准确、客观。再将组合权重与TOPSIS评价法结合起来,得到一种新的海水水质评价模型。
2) 以胶州湾12个监测站的监测数据作为评价对象,通过与文献 [
3) 本文提出的模型充分利用原始数据的信息,具有模型简单、不要求样本容量多少的优点,从而提高了海水水质评价结果的准确性,为海水水质评价提供了一种新的参考。
王 轶,陈 霞,郭梦灵,邹黎敏. 基于组合权重-TOPSIS的海水水质综合评价方法 A Comprehensive Evaluation Method of Seawater Quality Based on Combination Weight-TOPSIS[J]. 海洋科学前沿, 2024, 11(01): 10-20. https://doi.org/10.12677/AMS.2024.111002
https://doi.org/10.1016/j.eehl.2022.06.001
https://doi.org/10.1109/ACCESS.2020.2981528
https://doi.org/10.1016/j.cie.2019.04.023
https://doi.org/10.3390/en16010114