一种基于可解释人工智能技术的航空发动机健康衰退分析框架
An Explainable Artificial Intelligence Framework for Analyzing Health Degradation of Aero-Engines
DOI: 10.12677/airr.2025.141001, PDF, HTML, XML,    科研立项经费支持
作者: 张婉渝:成都天奥集团有限公司研发中心,四川 成都
关键词: Shapley值航空发动机聚类健康状态监测SkopeRulesShapley Values Aero-Engine Clustering Health Monitoring SkopeRules
摘要: 航空发动机作为复杂且关键的机械设备,其健康状态直接影响到飞行安全与运营效率。鉴于目前健康状态监测技术在可解释性和准确性上的局限性,本文提出了一种基于Shapley值的可解释人工智能分析框架。该框架通过解析机器学习模型的预测结果,揭示了发动机健康衰退的根本原因。首先,运用Shapley值分析法评估各传感器数据特征的边际贡献,识别了影响航空发动机健康的关键因素及其衰退路径。接着,应用HDBSCAN聚类算法识别潜在故障风险的发动机。最后,利用SkopeRules从聚类中提取易于理解且准确度高的规则集合,作为复杂模型决策的替代方案,增强了模型输出结果的透明度和可靠性。实验结果表明,该框架能够揭示航空发动机健康衰退的演变路径,为实现精准维护提供可靠的理论支撑。
Abstract: As a complex and critical mechanical equipment, the health status of aircraft engines directly affects flight safety and operational efficiency. Given the limitations of current health status monitoring technologies in terms of interpretability and accuracy, this paper proposes an interpretable artificial intelligence analysis framework based on Shapley values. This framework reveals the fundamental cause of engine health decline by analyzing the prediction results of machine learning models. Firstly, the Shapley value analysis method was used to evaluate the marginal contribution of each sensor data feature, identifying the key factors affecting the health of aircraft engines and their degradation paths. Next, the HDBSCAN clustering algorithm is applied to identify engines with potential fault risks. Finally, SkopeRules is used to extract a set of rules from clustering that are easy to understand and highly accurate, as an alternative to complex model decision-making, enhancing the transparency and reliability of the model output results. The experimental results indicate that the framework can reveal the evolutionary path of health decline in aircraft engines, providing reliable theoretical support for achieving precise maintenance.
文章引用:张婉渝. 一种基于可解释人工智能技术的航空发动机健康衰退分析框架[J]. 人工智能与机器人研究, 2025, 14(1): 1-13. https://doi.org/10.12677/airr.2025.141001

1. 引言

航空发动机作为飞机的关键动力源,其健康状况直接关乎飞行安全。航空发动机长期在高温、高压、高转速环境下运行,频繁遭受剧烈振动和冲击,极易导致发动机健康衰退,进而产生发动机推力不足、燃油效率降低等问题,严重时甚至可能引发灾难性事件。因此,通过航空发动机健康衰退研究,及时发现并预防故障隐患,对于保障飞行安全具有重要意义。

早期航空发动机健康衰退研究主要依赖于复杂的物理模型,涵盖材料、结构、热力学和流体力学等多个方面。例如,丁小飞等[1]构建了双转子动力学模型,追溯了振动的根源并提出振动抑制策略。栾孝驰等[2]结合声发射和振动分析技术,以提高对航空发动机故障识别能力。尽管此类方法具有较高的准确性和可靠性,但建模过程复杂且耗时,并且对专业性要求极高。

随着数据处理技术的快速发展,人工智能已成为重要的分析工具。通过对庞杂的发动机运行数据进行剖析并提取关键特征,从而构建发动机健康状态预测模型。孙同敏[3]通过将深度置信网络与最小二乘支持向量机相结合,实现了对航空发动机健康状态的自动化评估。张世杰等[4]采用多层感知机和时空图卷积网络来诊断航空发动机气路故障,为航空发动机健康管理探索了新的方向。张搏文等[5]改进了一维卷积神经网络,在标准卷积层前加入了概率密度信息层,进而提高了轴承健康监测的准确性。

尽管人工智能技术以其信息处理优势能够实现高精度预测,但在航空工业这一对安全要求极其苛刻的领域中,任何微小的概率误差都可能酿成灾难。因此,提升模型的透明度、增强其可靠性和稳健性对于推动人工智能技术在航空工业中的广泛应用显得尤为重要。所以,周志杰等[6]提出的基于规则的方法,能够清晰地展现系统的核心运作逻辑。在此基础上,程晓玉等[7]基于置信规则库建模技术,以增强模型的可解释性。但Zhijie Z等[8]为了解决置信规则库面临的可解释性损失问题,引入了一种包含“搜索强度”、“信念分布的可解释性约束”以及“规则激活因子”的新型优化策略。与此同时,王诗彬等[9]则将先验知识嵌入稀疏表示模型,构建高透明度核心网络,从而有效改善了模型的可解释性。

尽管现有研究展示了人工智能在航空发动机健康管理中的显著成效,并初步探索了模型的可解释性。但仍存在若干不足,目前提升决策透明度的策略主要依赖于专家经验制定的规则和设计可解释的模型结构。传统规则易于理解但难以适应高维动态特征空间;而基于可解释模型结构的方法虽能较好处理高维数据,但其解释机制易随模型结构变化而失效。为克服这些局限,本文构建了一种基于Shapley值的可解释人工智能框架。该框架通过预测航空发动机健康状态,利用Shapley值进行特征重要性分析,并结合聚类技术和规则挖掘算法,形成一种模型无关且高度可解释的技术方案。此框架不仅能够深入解析发动机健康衰退机制,还具有广泛应用于工业装备健康管理及故障预诊断的潜力。

2. 研究方法

为了深入剖析航空发动机健康状态退化的内在机制,本文构建了一种基于可解释人工智能技术的分析框架如图1所示。该框架首先对原始数据进行预处理并提取关键统计特征,然后建立健康状态预测模型。利用Shapley值方法量化各传感器特征对预测结果的边际贡献,识别出影响发动机健康衰退的关键因素及其路径。接着,通过降维和HDBSCAN [10]聚类算法识别潜在故障风险群体,并采用SkopeRules [11]从这些群体中抽取易于理解和高准确度的规则集,以增强模型决策的透明度与可靠性。随后部分将详细介绍所用核心技术:Shapley值、非线性降维、HDBSCAN聚类及SkopeRules规则挖掘。

Figure 1. Explainable artificial intelligence analysis framework

1. 可解释人工智能分析框架

2.1. Shapley

Shapley值的概念起源于博弈论,其理论基础在于对参与者个体贡献的量化分析,即在一个协作环境中,每位参与者的边际贡献取决于参与者进入合作序列的位置及其对于最终成果的影响程度。随着理论框架的不断演进,Shapley值逐渐成为解析模型内部机制的关键手段之一,并由Lundberg [12]等学者进一步优化。将这一方法应用于机器学习领域时,特别是在构建航空发动机健康状态监测系统的过程中,Shapley值提供了一种有效的方法来评估各个输入变量(如温度、压力及振动水平)对于最终预测结果的重要性。例如,针对特定发动机样本x的健康状况预估值可以表达为基准预测值与所有相关特征对应的Shapley值之和:

f ( x ) = E [ f ( X ) ] + i = 1 N ϕ i ( f , x ) (1)

其中, E [ f ( X ) ] 表示基准预测值,X为测试样本集合, ϕ i ( f , x ) 表示第i个特征对发动机样本x健康状态预测结果的具体影响度量,可通过下述公式精确计算得出:

ϕ i ( f , x ) = S f \ { i } | S | ! ( | N | | S | 1 ) ! N ! [ f x ( S { i } ) f x ( S ) ] (2)

其中,F代表所有特征集合,N代表特征总数,S表示不含特征i的任意子集,f则是预测模型, f x ( S { i } ) f x ( S ) 反映了添加特征i后相对于原有子集S预测输出的边际增益变化。

进一步地,为了从全局视角考察某一特定特征在整个数据集内对模型表现的平均影响力,定义特征i的整体Shapley值如下所示:

ϕ i ( f ) = 1 | X | x X ϕ i ( f , x ) (3)

通过Shapley分析方法,不仅能够量化单个因素的重要程度,也能揭示出各因素间复杂的交互作用模式,为后续开展针对性维护策略制定提供了坚实的理论依据。

2.2. UMAP

UMAP [13] (Uniform Manifold Approximation and Projection)是一种基于流形学习和拓扑数据分析的非线性降维技术。核心原理是将高维数据中的局部邻域结构映射到低维空间中,以便更好地进行分析和可视化。UMAP的算法分为两个关键步骤:

1) 计算高维空间中的局部相似性

UMAP首先在高维空间中为每个数据点构建一个局部邻域图,领域图通过构建每个数据点的k最近邻点实现。对于高维空间中的点 x i x j ,其局部相似性计算公式为:

p j | i = exp ( x i x j 2 / σ i 2 ) k N ( i ) exp ( x i x k 2 / σ i 2 ) (4)

其中, σ i 是以 x i 中心的高斯核的带宽超参数,通常根据邻域内点的密度来确定, N ( i ) 表示 x i k近邻集合。为了使矩阵对称,使用以下公式计算最终的相似性矩阵,n是数据点的数量:

p i j = p j | i + p i | j 2 n (5)

2) 优化低维嵌入

在低维空间中,UMAP试图找到一个嵌入 y j ,使得低维空间中的分布 q i j 尽可能接近高维空间中的分布 p i j ,然后通过最小化高维和低维空间分布之间的交叉熵来优化数据在低维空间中的布局,并通过梯度下降等优化算法进行求解,以找到最佳的低维嵌入。优化目标为:

C ( P , Q ) = i j p i j log p i j q i j (6)

2.3. HDBSCAN

HDBSCAN作为一种基于密度的空间聚类技术,在DBSCAN的基础上进行了改进,能够更有效地处理不同密度级别的聚类及噪声点,从而揭示数据内部的潜在子群。相较于传统的k-means [14]与模糊C均值(fuzzy c-means) [15]等聚类方法,HDBSCAN的优势在于无需预先设定聚类的数量。具体实现步骤如下:

1) 计算互达距离:给定半径 ε 和最小样本量超参数,对于每一对点pq,计算它们之间的互达距离。

c o r e _ d i s t ε ( p ) = min ( ε , d i s t k ( p ) ) (7)

r e a c h a b i l i t y _ d i s t = max ( c o r e _ d i s t ε ( p ) , c o r e _ d i s t ε ( q ) , d ( p , q ) ) (8)

其中, d i s t k ( p ) 表示p点到第k个邻点的距离, c o r e _ d i s t ε ( p ) p点的核心距离, d ( p , q ) 为点pq之间的欧式距离。

2) 构建最小生成树:基于互达距离构建一个邻域图,其中每个点都与它的近邻点相连,连接边的权重为该点与邻点的互达距离,然后基于Kruskal等算法构建最小生成树。

3) 生成层次聚类树:基于构建好的最小生成树,从树中选择权重最小的边,将这条边所连接的两个顶点合并成一个新的簇。重复此过程直到所有点都被合并,以此形成一个自底向上的层次聚类树。

4) 切割树并选择最优簇:为了选择最优的簇集合,评估不同层次上的簇稳定性,选择表现出较高稳定性的层次作为最终的簇集合。在最终确定的簇中,不属于任何簇的点被视为噪声点。

2.4. SkopeRules

SkopeRules是一种用于学习规则的机器学习方法,通过生成一组易于理解的逻辑规则进行分类。规则生成和选择过程可以描述为下步骤:

1) 初始化:选择一个特征子集F和一个初始规则集合 R = Φ

2) 规则生成:对于每个特征 f i F ,生成一系列候选规则 r i j j表示规则序号。

3) 规则评估:对于每条规则 r i j ,计算性能指标,包括精确率、召回率、F1分数。

4) 规则选择:选择F1分数最高的规则加入规则集合R

5) 重复规则生成、评估、选择步骤,直到没有更好的规则可添加或者达到预设的停止条件,最后输出规则集合。

3. 实验

3.1. 数据集

本研究采用的数据来自NASA Ames研究中心、苏黎世联邦理工学院及PARC联合开发的CMAPSS动态模型生成的N-CMAPSS [16]数据集,动态模型结构如图2所示。该数据集模拟了实际飞行条件下涡扇发动机从运行到故障的过程,包含8个子集,6825个飞行周期,涵盖90个发动机单元,每个单元平均约75个周期。数据集中包括18个传感器指标的持续监测读数以及每个操作周期内固定的辅助变量,变量描述详见表1。数据集中航空发动机的健康状态被标记为“健康”或“不健康”。本研究旨在利用N-CMAPSS数据集验证所提方法的有效性和准确性,以解析航空发动机的健康衰退机制。

Figure 2. Schematic diagram of a turbofan engine

2. 涡轮风扇发动机示意图

Table 1. Variable descriptions

1. 变量描述

变量符号

描述

单位

hs

健康状态

-

RUL

剩余使用寿命

cycle

飞行周期

-

Fc

飞行等级

-

alt

海拔

ft

March

飞行马赫数

-

TRA

节气门开启角度

%

T2

风扇入口处总温度

˚R

Wf

燃油流量

pps

Nf

物理风扇速度

rpm

Nc

核心机物理转速

rpm

T24

低压压气机(LPC)出口处总温度

˚R

T30

高压压气机(HPC)出口处总温度

˚R

T48

高压涡轮(HPT)出口处总温度

˚R

T50

低压涡轮(LPT)出口处总温度

˚R

续表

P15

旁路管道中总压力

psia

P2

风机入口处总压力

psia

P21

风机出口总压力

psia

P24

低压压气机(LPC)出口处总压力

psia

Ps30

高压压气机(HPC)出口处静压

psia

P40

燃烧器出口总压力

psia

P50

低压涡轮(LPT)出口处总压力

psia

3.2. 实验步骤

本研究专注于航空发动机健康状态评估,结合Shapley值分析以识别关键影响因素。基于分析结果,采用UMAP技术进行数据降维,并运用HDBSCAN聚类算法识别潜在故障发动机,进一步通过SkopeRules方法对聚类结果提取规则,进而实现复杂模型透明化,为不同衰退程度的发动机提供维护策略与优化建议。具体实验步骤如下:

1) 数据预处理:从18个时间序列变量中提取了7个关键统计特征:平均值、标准差、最小值、四分之一位数、中位数、四分之三位数和最大值,例如LPT出口处总温度的特征表示为T50_mean、T50_std、T50_min、T50_Q1、T50_median、T50_Q3、T50_max。此外,还加入了飞行周期和飞行等级两个辅助变量,共128个特征。通过对不同发动机在多个运行周期内的这些特征进行提取,构建了一个包含6825个样本的数据集,并进行归一化处理。最终,按8:2的比例随机划分为训练集(5460个样本)和测试集(1365个样本)。

2) 模型训练:为有效提取航空发动机健康衰退的关键信息,本文构建了两个模型:神经网络模型M1和XGBoost分类模型M2。M1采用三层前馈神经网络,包含两个48神经元的隐藏层和一个2节点的输出层,使用ReLU作为激活函数。M2基于XGBoost算法,设置100棵决策树、最大深度为4,并引入L1正则化以增强泛化能力。经过训练优化,两个模型在F1分数上均超过90%。

3) Shapley值分析:基于训练完成的M1和M2模型对测试集进行预测。然后,计算测试集中每个特征对于预测结果的Shapley值。通过对Shapley值的分析,揭示各个特征变量对于预测结果的贡献度和排序,并对两个模型的解释结果进行对比分析,从而求证Shapley值分析法的模型无关性。

4) 聚类分析:首先,运用UMAP方法分别对原始特征以及M1模型的Shapley值进行降维处理。随后,利用HDBSCAN算法对降维后的结果进行聚类分析,探索发动机健康状态中的潜藏子群体。最后,探究各子群体中发动机的剩余使用寿命特性。

5) SkopeRules分析:基于聚类分析的结果,运用SkopeRules算法方法来探索聚类子群中的潜藏模式,并从中推导出高精度透明化的规则集合。

3.3. 实验结果及讨论

3.3.1. Shapley分析

在实施Shapley值分析的过程中,为了全面评估M1和M2模型的性能,采用了精确率、召回率、F1分数作为评估指标。如表2所示,健康与不健康类别预测结果的F1分数均超过97%,充分验证了两个模型在评估发动机健康状态方面的精确性。

Table 2. Evaluation metrics for M1 and M2 models

2. M1与M2模型评估指标

标签

精确率

召回率

F1分数

M1

0 (不健康)

0.982

0.992

0.986

1 (健康)

0.984

0.966

0.974

M2

0 (不健康)

0.990

0.990

0.990

1 (健康)

0.973

0.982

0.977

在航空发动机健康状态预测方面,M1和M2模型均表现出显著的有效性。然而,对于处于非健康状态的发动机,这两个模型未能揭示其健康衰退的具体原因。为此,本研究引入Shapley值分析法以量化并排序各特征对两模型预测结果的贡献度,进而探究发动机健康衰退的根本因素。图3图4分别展示了基于M1和M2模型下,不同特征按照其重要性进行排序的结果。在此,每个数据点代表一个独立的预测案例;横轴显示了特定特征的Shapley值,用以衡量该特征对模型预测边际效应的影响程度;纵轴则标注了具体特征数值。此外,通过颜色编码增强了可视化效果:红色表示较高特征值的数据点,蓝色则对应较低特征值,从而直观地反映了各个特征对模型输出影响的不同程度。

通过对图3图4的综合分析,可以得出结论:飞行周期(cycle)在所有因素中占据核心地位,是决定发动机健康状态的关键因素。随着飞行周期的数量增长,发动机健康状态呈现恶化趋势。此外,飞行等级(Fc)作为次要影响因素,细分为三个级别:1、2、3,分别对应短途、中途和长途飞行任务,表3详细列出了在实验条件下各飞行等级所对应的飞行条件。其中,长途飞行对发动机造成的磨损相对较大,而短途飞行则对健康状态的影响较小。除上述关键因素外,其他特性对于发动机健康状况的影响显得较为有限,未能形成显著的相关性。图3图4之间关于飞行周期及飞行等级所揭示的趋势表现出高度的一致性,仅在一些影响力较弱的因素上存在细微差别。这一发现有效验证了Shapley值分析作为一种模型无关解释方法的有效性,无论是在基于神经网络还是集成学习构建的预测模型框架下,该方法都能够一致地识别出影响发动机健康状态的主要因素。

Figure 3. Shapley value distribution based on the M1 model

3. 基于M1模型的Shapley值分布图

Figure 4. Shapley value distribution based on the M2 model

4. 基于M2模型的Shapley值分布图

Table 3. Flight level classification

3. 飞行等级划分

飞行等级

飞行时长(小时)

飞行次数

1

1~3

18

2

3~5

149

3

>5

185

3.3.2. HDBSCAN分析

在上述Shapley分析中,我们得知飞行周期是航空发动机健康衰退最重要的因素,并且随着飞行周期的逐渐增加,其健康状态呈现逐渐衰退的趋势,表明了健康与不健康状态之间边界的模糊性,两者间缺乏一个绝对的阈值区分。为深入探究介于这两种明确状态之间的其他潜藏状态,本文采用HDBSCAN算法对样本数据进行聚类分析。旨在识别健康与不健康类别之外的样本群体,并揭示这些样本群内在的分布规律。

为了更为直观地展示聚类结果,本文采用UMAP方法对特征进行降维,UMAP关键参数如表4所示:

Table 4. Key parameter settings for UMAP

4. UMAP关键参数设置

参数名称

参数值

最近邻点数量

200

样本间最小距离

0.01

嵌入的维度

2

距离度量方法

correlation

迭代次数

500

根据上述UMAP方法降维得到低维特征向量UMAP_1和UMAP_2,并采用HDBSCAN算法对测试样本进行聚类,HDBSCAN算法的关键参数如表5所示:

Table 5. Key parameter settings for HDBSCAN

5. HDBSCAN关键参数设置

参数名称

参数值

最小样本数

200

核心点最小邻居数

10

距离度量方法

euclidean

最近邻方法

kd_tree

HDBSCAN聚类算法应用于低维特征向量的结果如图5所示,揭示了除健康和不健康状态之外存在难以明确分类的航空发动机样本。这一发现支持了随着飞行周期增加,部分发动机表现出介于完全健康与完全不健康之间的过渡状态的观点。然而,图5中显示的簇间边界模糊及较低的内聚性,特别是对于那些分布更为分散的“其他”类别发动机,表明将这些样本归为同一类别并不十分合理,也反映出原始特征信息未能得到充分利用。为此,本研究进一步采用HDBSCAN算法对经Shapley值降维处理后的特征向量进行了聚类分析,其结果见图6

图5图6的对比结果可以看出,图6所呈现的聚类效果更好,类内距离更小,类间距更大,簇之间呈现明确的可分性,能够直观地反映存在潜藏风险的航空发动机群体。此对比结果有效证实了Shapley值对于特征关键信息的有效攫取,同时也表现出该方法在聚类算法中的有效运用。

3.3.3. SkopeRules分析

在上述实验结果中,我们识别出一类具有潜在风险的航空发动机,其特征表现为剩余使用寿命介于健康与不健康状态之间。基于此发现,本研究根据平均剩余使用寿命将航空发动机重新分类为健康、亚健康和不健康三类。为进一步提高模型决策过程的透明度,并直观描述各类别形成的条件,采用SkopeRules方法对这三种健康状态进行规则提取,其结果见图7。所获得的规则集旨在替代原有的神经网络模型,以降低部署成本和推理时间,增强预测模型在实际应用中的可解释性和实用性。

Figure 5. Clustering of engine health status using dimensionality reduction of original features

5. 基于原始特征降维的发动机健康状态聚类图

Figure 6. Clustering of engine health status based on dimensionality reduction using Shapley values

6. 基于Shapley值降维的发动机健康状态聚类图

Figure 7. Box plot of remaining useful life for subgroups of engine health status

7. 发动机健康状态子群的剩余使用寿命箱线图

本文采用Python中的SkopeRules工具对聚类结果进行描述性规则提取,其关键参数设置如表6所示。

Table 6. Key parameter settings for SkopeRules

6. SkopeRules关键参数设置

参数名称

参数值

树的最大去重深度

3

树的数量

100

最小精确度

0.5

最小召回率

0.5

通过SkopeRules对发动机健康状态三大类别提取的规则如表7所示:

Table 7. Rule descriptions for engine health status

7. 发动机健康状态的规则描述

健康状态

规则

精确率

召回率

F1分数

健康

飞行周期数 ≤ 34.5

飞行等级 ≤ 1.5

0.701

0.933

0.801

亚健康

飞行周期数 ≤ 36.5

飞行等级 > 1.5

0.995

0.950

0.972

不健康

飞行周期数 > 36.5

0.998

0.975

0.986

表7可以看出,飞行周期数是决定航空发动机健康状态的关键因素,这与Shapley分析结果一致,验证了其结论的可靠性。当飞行周期数超过36.5时,发动机更易进入不健康状态。由于单个飞行周期内执行的任务类型多样,仅凭飞行周期数难以准确判断发动机健康状况,还需结合飞行等级来辅助识别。较高飞行等级意味着更长的飞行时间和更多班次,加速了发动机的健康退化,从而处于亚健康状态。相对于M1和M2模型的预测精度,在规则集下的健康和亚健康类别的预测精度略有下降,而不健康类别的F1分数保持不变,三类别的F1分数均超过80%。尽管整体分类精度有所牺牲,但三分类提供了更为细致的状态描述,有助于针对不同健康状态制定差异化维护计划,从而提升资源利用效率及维修效果。

4. 结论

本研究提出了一种基于Shapley值的可解释人工智能框架,旨在深入探讨航空发动机健康状态退化机制。通过该框架的应用,实现了对各个因素对航空发动机健康影响的量化评估,揭示了健康衰退机制。研究结果表明,在所有考虑因素中,飞行周期数对发动机健康状态的影响最为显著。此外,研究证实了无论是采用神经网络模型还是基于决策树算法的集成学习模型,运用Shapley值分析所获得的结果均表现出高度一致性。进一步地,将Shapley值与UMAP降维方法及和HDBSCAN聚类算法相结合,有效地从健康发动机中甄别出潜在风险较高的亚健康发动机群体,并通过SkopeRules工具对处于不同健康水平的发动机群体进行规则归纳,明确了飞行周期是区分发动机是否开始进入不健康阶段的关键指标,而飞行等级高低是判断发动机是否维持健康状态或已步入亚健康状态的重要依据。这不仅验证了所提框架在不同预测模型之间具有良好的无关特性,还识别出了发动健康衰退的关键因素,明确了健康衰退过程中的关键转折条件,为实施航空发动机的预防性维护提供了坚实的理论依据。

5. 展望

本文利用N-CMAPSS数据集,评估了基于Shapley值的可解释人工智能框架在航空发动机健康状态预测中的有效性,揭示了发动机退化机理,并加深了对健康衰退过程的理解,从而为实现经济效益的预测性健康管理提供了支持。尽管如此,Shapley值计算的高成本限制了其实用性,且在非线性模型中,其解释力相较于线性模型显得更加抽象。因此,未来的研究需聚焦于提高计算效率及开发更直观的非线性特征解释方法,以促进可解释人工智能技术的发展与广泛应用。

基金项目

中电天奥产业发展基金“风电场智慧运维大数据平台”(202201090404)。

参考文献

[1] 丁小飞, 廖明夫, 韩方军, 等. 某型航空发动机振动值波动故障诊断和排除[J]. 振动测试与诊断, 2024, 44(2): 274-279.
[2] 栾孝驰, 佟鑫宇, 沙云东, 等. 基于振动与声发射敏感参数识别的主轴承故障诊断方法[J]. 推进技术, 2024, 45(12): 269-281.
[3] 孙同敏. 基于DBN-SVM的航空发动机健康状态评估方法[J]. 控制工程, 2021, 28(6): 1163-1170.
[4] 张世杰, 胡家文, 苗国磊. 基于工况识别与自训练时空图卷积的航空发动机气路故障诊断[J]. 推进技术, 2024, 45(11): 245-254.
[5] 张搏文, 庞新宇, 程宝安, 等. 基于PIRD-CNN的航空发动机轴承故障诊断方法研究[J]. 振动与冲击, 2024, 43(18): 201-207.
[6] 周志杰, 曹友, 胡昌华, 等. 基于规则的建模方法的可解释性及其发展[J]. 自动化学报, 2021, 47(6): 1201-1216.
[7] 程晓玉, 韩鹏, 贺维, 等. 一种新的基于可解释性置信规则库的飞轮健康状态评估模型[J]. 航空学报, 2023, 44(S1): 177-189.
[8] Zhou, Z., Cao, Y., Hu, G., Zhang, Y., Tang, S. and Chen, Y. (2021) New Health-State Assessment Model Based on Belief Rule Base with Interpretability. Science China Information Sciences, 64, 209-223.
https://doi.org/10.1007/s11432-020-3001-7
[9] 王诗彬, 王世傲, 陈雪峰, 等. 可解释性智能监测诊断网络构造及航空发动机整机试车与中介轴承诊断应用[J]. 机械工程学报, 2024, 60(12): 90-106.
[10] McInnes, L., Healy, J. and Astels, S. (2017) HDBSCAN: Hierarchical Density Based Clustering. The Journal of Open Source Software, 2, Article No. 205.
https://doi.org/10.21105/joss.00205
[11] Gardin, F., Gautier, R., Goix, N., et al. (2018) Skope-Rules: Machine Learning with Logical Rules in Python.
https://github.com/scikit-learn-contrib/skope-rules
[12] Lundberg, S.M., Allen, P.G. and Lee, S.-I. (2017) A Unified Approach to Interpreting Model Predictions. Proceedings of the 31st International Conference on Neural Information Processing Systems, Long Beach, 4-9 December 2017, 4768-4777
[13] McInnes, L., Healy, J. and Melville, J. (2018) UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction.
[14] Sinaga, K.P. and Yang, M. (2020) Unsupervised K-Means Clustering Algorithm. IEEE Access, 8, 80716-80727.
https://doi.org/10.1109/access.2020.2988796
[15] Lin, Y. and Chen, S. (2021) A Centroid Auto-Fused Hierarchical Fuzzy C-Means Clustering. IEEE Transactions on Fuzzy Systems, 29, 2006-2017.
https://doi.org/10.1109/tfuzz.2020.2991306
[16] Chao, M., Kulkarni, C., Goebel, K. and Fink, O. (2021) Aircraft Engine Run-to-Failure Dataset under Real Flight Conditions. NASA Ames Prognostics Data Repository.
https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/#turbofan-2

Baidu
map