1. 引言
航空发动机作为飞机的关键动力源,其健康状况直接关乎飞行安全。航空发动机长期在高温、高压、高转速环境下运行,频繁遭受剧烈振动和冲击,极易导致发动机健康衰退,进而产生发动机推力不足、燃油效率降低等问题,严重时甚至可能引发灾难性事件。因此,通过航空发动机健康衰退研究,及时发现并预防故障隐患,对于保障飞行安全具有重要意义。
早期航空发动机健康衰退研究主要依赖于复杂的物理模型,涵盖材料、结构、热力学和流体力学等多个方面。例如,丁小飞等[1]构建了双转子动力学模型,追溯了振动的根源并提出振动抑制策略。栾孝驰等[2]结合声发射和振动分析技术,以提高对航空发动机故障识别能力。尽管此类方法具有较高的准确性和可靠性,但建模过程复杂且耗时,并且对专业性要求极高。
随着数据处理技术的快速发展,人工智能已成为重要的分析工具。通过对庞杂的发动机运行数据进行剖析并提取关键特征,从而构建发动机健康状态预测模型。孙同敏[3]通过将深度置信网络与最小二乘支持向量机相结合,实现了对航空发动机健康状态的自动化评估。张世杰等[4]采用多层感知机和时空图卷积网络来诊断航空发动机气路故障,为航空发动机健康管理探索了新的方向。张搏文等[5]改进了一维卷积神经网络,在标准卷积层前加入了概率密度信息层,进而提高了轴承健康监测的准确性。
尽管人工智能技术以其信息处理优势能够实现高精度预测,但在航空工业这一对安全要求极其苛刻的领域中,任何微小的概率误差都可能酿成灾难。因此,提升模型的透明度、增强其可靠性和稳健性对于推动人工智能技术在航空工业中的广泛应用显得尤为重要。所以,周志杰等[6]提出的基于规则的方法,能够清晰地展现系统的核心运作逻辑。在此基础上,程晓玉等[7]基于置信规则库建模技术,以增强模型的可解释性。但Zhijie Z等[8]为了解决置信规则库面临的可解释性损失问题,引入了一种包含“搜索强度”、“信念分布的可解释性约束”以及“规则激活因子”的新型优化策略。与此同时,王诗彬等[9]则将先验知识嵌入稀疏表示模型,构建高透明度核心网络,从而有效改善了模型的可解释性。
尽管现有研究展示了人工智能在航空发动机健康管理中的显著成效,并初步探索了模型的可解释性。但仍存在若干不足,目前提升决策透明度的策略主要依赖于专家经验制定的规则和设计可解释的模型结构。传统规则易于理解但难以适应高维动态特征空间;而基于可解释模型结构的方法虽能较好处理高维数据,但其解释机制易随模型结构变化而失效。为克服这些局限,本文构建了一种基于Shapley值的可解释人工智能框架。该框架通过预测航空发动机健康状态,利用Shapley值进行特征重要性分析,并结合聚类技术和规则挖掘算法,形成一种模型无关且高度可解释的技术方案。此框架不仅能够深入解析发动机健康衰退机制,还具有广泛应用于工业装备健康管理及故障预诊断的潜力。
2. 研究方法
为了深入剖析航空发动机健康状态退化的内在机制,本文构建了一种基于可解释人工智能技术的分析框架如图1所示。该框架首先对原始数据进行预处理并提取关键统计特征,然后建立健康状态预测模型。利用Shapley值方法量化各传感器特征对预测结果的边际贡献,识别出影响发动机健康衰退的关键因素及其路径。接着,通过降维和HDBSCAN [10]聚类算法识别潜在故障风险群体,并采用SkopeRules [11]从这些群体中抽取易于理解和高准确度的规则集,以增强模型决策的透明度与可靠性。随后部分将详细介绍所用核心技术:Shapley值、非线性降维、HDBSCAN聚类及SkopeRules规则挖掘。
Figure 1. Explainable artificial intelligence analysis framework
图1. 可解释人工智能分析框架
2.1. Shapley
Shapley值的概念起源于博弈论,其理论基础在于对参与者个体贡献的量化分析,即在一个协作环境中,每位参与者的边际贡献取决于参与者进入合作序列的位置及其对于最终成果的影响程度。随着理论框架的不断演进,Shapley值逐渐成为解析模型内部机制的关键手段之一,并由Lundberg [12]等学者进一步优化。将这一方法应用于机器学习领域时,特别是在构建航空发动机健康状态监测系统的过程中,Shapley值提供了一种有效的方法来评估各个输入变量(如温度、压力及振动水平)对于最终预测结果的重要性。例如,针对特定发动机样本x的健康状况预估值可以表达为基准预测值与所有相关特征对应的Shapley值之和:
(1)
其中,
表示基准预测值,X为测试样本集合,
表示第i个特征对发动机样本x健康状态预测结果的具体影响度量,可通过下述公式精确计算得出:
(2)
其中,F代表所有特征集合,N代表特征总数,S表示不含特征i的任意子集,f则是预测模型,
反映了添加特征i后相对于原有子集S预测输出的边际增益变化。
进一步地,为了从全局视角考察某一特定特征在整个数据集内对模型表现的平均影响力,定义特征i的整体Shapley值如下所示:
(3)
通过Shapley分析方法,不仅能够量化单个因素的重要程度,也能揭示出各因素间复杂的交互作用模式,为后续开展针对性维护策略制定提供了坚实的理论依据。
2.2. UMAP
UMAP [13] (Uniform Manifold Approximation and Projection)是一种基于流形学习和拓扑数据分析的非线性降维技术。核心原理是将高维数据中的局部邻域结构映射到低维空间中,以便更好地进行分析和可视化。UMAP的算法分为两个关键步骤:
1) 计算高维空间中的局部相似性
UMAP首先在高维空间中为每个数据点构建一个局部邻域图,领域图通过构建每个数据点的k最近邻点实现。对于高维空间中的点
和
,其局部相似性计算公式为:
(4)
其中,
是以
中心的高斯核的带宽超参数,通常根据邻域内点的密度来确定,
表示
的k近邻集合。为了使矩阵对称,使用以下公式计算最终的相似性矩阵,n是数据点的数量:
(5)
2) 优化低维嵌入
在低维空间中,UMAP试图找到一个嵌入
,使得低维空间中的分布
尽可能接近高维空间中的分布
,然后通过最小化高维和低维空间分布之间的交叉熵来优化数据在低维空间中的布局,并通过梯度下降等优化算法进行求解,以找到最佳的低维嵌入。优化目标为:
(6)
2.3. HDBSCAN
HDBSCAN作为一种基于密度的空间聚类技术,在DBSCAN的基础上进行了改进,能够更有效地处理不同密度级别的聚类及噪声点,从而揭示数据内部的潜在子群。相较于传统的k-means [14]与模糊C均值(fuzzy c-means) [15]等聚类方法,HDBSCAN的优势在于无需预先设定聚类的数量。具体实现步骤如下:
1) 计算互达距离:给定半径
和最小样本量超参数,对于每一对点p和q,计算它们之间的互达距离。
(7)
(8)
其中,
表示p点到第k个邻点的距离,
是p点的核心距离,
为点p和q之间的欧式距离。
2) 构建最小生成树:基于互达距离构建一个邻域图,其中每个点都与它的近邻点相连,连接边的权重为该点与邻点的互达距离,然后基于Kruskal等算法构建最小生成树。
3) 生成层次聚类树:基于构建好的最小生成树,从树中选择权重最小的边,将这条边所连接的两个顶点合并成一个新的簇。重复此过程直到所有点都被合并,以此形成一个自底向上的层次聚类树。
4) 切割树并选择最优簇:为了选择最优的簇集合,评估不同层次上的簇稳定性,选择表现出较高稳定性的层次作为最终的簇集合。在最终确定的簇中,不属于任何簇的点被视为噪声点。
2.4. SkopeRules
SkopeRules是一种用于学习规则的机器学习方法,通过生成一组易于理解的逻辑规则进行分类。规则生成和选择过程可以描述为下步骤:
1) 初始化:选择一个特征子集F和一个初始规则集合
。
2) 规则生成:对于每个特征
,生成一系列候选规则
,j表示规则序号。
3) 规则评估:对于每条规则
,计算性能指标,包括精确率、召回率、F1分数。
4) 规则选择:选择F1分数最高的规则加入规则集合R。
5) 重复规则生成、评估、选择步骤,直到没有更好的规则可添加或者达到预设的停止条件,最后输出规则集合。
3. 实验
3.1. 数据集
本研究采用的数据来自NASA Ames研究中心、苏黎世联邦理工学院及PARC联合开发的CMAPSS动态模型生成的N-CMAPSS [16]数据集,动态模型结构如图2所示。该数据集模拟了实际飞行条件下涡扇发动机从运行到故障的过程,包含8个子集,6825个飞行周期,涵盖90个发动机单元,每个单元平均约75个周期。数据集中包括18个传感器指标的持续监测读数以及每个操作周期内固定的辅助变量,变量描述详见表1。数据集中航空发动机的健康状态被标记为“健康”或“不健康”。本研究旨在利用N-CMAPSS数据集验证所提方法的有效性和准确性,以解析航空发动机的健康衰退机制。
Figure 2. Schematic diagram of a turbofan engine
图2. 涡轮风扇发动机示意图
Table 1. Variable descriptions
表1. 变量描述
变量符号 |
描述 |
单位 |
hs |
健康状态 |
- |
RUL |
剩余使用寿命 |
年 |
cycle |
飞行周期 |
- |
Fc |
飞行等级 |
- |
alt |
海拔 |
ft |
March |
飞行马赫数 |
- |
TRA |
节气门开启角度 |
% |
T2 |
风扇入口处总温度 |
˚R |
Wf |
燃油流量 |
pps |
Nf |
物理风扇速度 |
rpm |
Nc |
核心机物理转速 |
rpm |
T24 |
低压压气机(LPC)出口处总温度 |
˚R |
T30 |
高压压气机(HPC)出口处总温度 |
˚R |
T48 |
高压涡轮(HPT)出口处总温度 |
˚R |
T50 |
低压涡轮(LPT)出口处总温度 |
˚R |
续表
P15 |
旁路管道中总压力 |
psia |
P2 |
风机入口处总压力 |
psia |
P21 |
风机出口总压力 |
psia |
P24 |
低压压气机(LPC)出口处总压力 |
psia |
Ps30 |
高压压气机(HPC)出口处静压 |
psia |
P40 |
燃烧器出口总压力 |
psia |
P50 |
低压涡轮(LPT)出口处总压力 |
psia |
3.2. 实验步骤
本研究专注于航空发动机健康状态评估,结合Shapley值分析以识别关键影响因素。基于分析结果,采用UMAP技术进行数据降维,并运用HDBSCAN聚类算法识别潜在故障发动机,进一步通过SkopeRules方法对聚类结果提取规则,进而实现复杂模型透明化,为不同衰退程度的发动机提供维护策略与优化建议。具体实验步骤如下:
1) 数据预处理:从18个时间序列变量中提取了7个关键统计特征:平均值、标准差、最小值、四分之一位数、中位数、四分之三位数和最大值,例如LPT出口处总温度的特征表示为T50_mean、T50_std、T50_min、T50_Q1、T50_median、T50_Q3、T50_max。此外,还加入了飞行周期和飞行等级两个辅助变量,共128个特征。通过对不同发动机在多个运行周期内的这些特征进行提取,构建了一个包含6825个样本的数据集,并进行归一化处理。最终,按8:2的比例随机划分为训练集(5460个样本)和测试集(1365个样本)。
2) 模型训练:为有效提取航空发动机健康衰退的关键信息,本文构建了两个模型:神经网络模型M1和XGBoost分类模型M2。M1采用三层前馈神经网络,包含两个48神经元的隐藏层和一个2节点的输出层,使用ReLU作为激活函数。M2基于XGBoost算法,设置100棵决策树、最大深度为4,并引入L1正则化以增强泛化能力。经过训练优化,两个模型在F1分数上均超过90%。
3) Shapley值分析:基于训练完成的M1和M2模型对测试集进行预测。然后,计算测试集中每个特征对于预测结果的Shapley值。通过对Shapley值的分析,揭示各个特征变量对于预测结果的贡献度和排序,并对两个模型的解释结果进行对比分析,从而求证Shapley值分析法的模型无关性。
4) 聚类分析:首先,运用UMAP方法分别对原始特征以及M1模型的Shapley值进行降维处理。随后,利用HDBSCAN算法对降维后的结果进行聚类分析,探索发动机健康状态中的潜藏子群体。最后,探究各子群体中发动机的剩余使用寿命特性。
5) SkopeRules分析:基于聚类分析的结果,运用SkopeRules算法方法来探索聚类子群中的潜藏模式,并从中推导出高精度透明化的规则集合。
3.3. 实验结果及讨论
3.3.1. Shapley分析
在实施Shapley值分析的过程中,为了全面评估M1和M2模型的性能,采用了精确率、召回率、F1分数作为评估指标。如表2所示,健康与不健康类别预测结果的F1分数均超过97%,充分验证了两个模型在评估发动机健康状态方面的精确性。
Table 2. Evaluation metrics for M1 and M2 models
表2. M1与M2模型评估指标
|
标签 |
精确率 |
召回率 |
F1分数 |
M1 |
0 (不健康) |
0.982 |
0.992 |
0.986 |
1 (健康) |
0.984 |
0.966 |
0.974 |
M2 |
0 (不健康) |
0.990 |
0.990 |
0.990 |
1 (健康) |
0.973 |
0.982 |
0.977 |
在航空发动机健康状态预测方面,M1和M2模型均表现出显著的有效性。然而,对于处于非健康状态的发动机,这两个模型未能揭示其健康衰退的具体原因。为此,本研究引入Shapley值分析法以量化并排序各特征对两模型预测结果的贡献度,进而探究发动机健康衰退的根本因素。图3与图4分别展示了基于M1和M2模型下,不同特征按照其重要性进行排序的结果。在此,每个数据点代表一个独立的预测案例;横轴显示了特定特征的Shapley值,用以衡量该特征对模型预测边际效应的影响程度;纵轴则标注了具体特征数值。此外,通过颜色编码增强了可视化效果:红色表示较高特征值的数据点,蓝色则对应较低特征值,从而直观地反映了各个特征对模型输出影响的不同程度。
通过对图3与图4的综合分析,可以得出结论:飞行周期(cycle)在所有因素中占据核心地位,是决定发动机健康状态的关键因素。随着飞行周期的数量增长,发动机健康状态呈现恶化趋势。此外,飞行等级(Fc)作为次要影响因素,细分为三个级别:1、2、3,分别对应短途、中途和长途飞行任务,表3详细列出了在实验条件下各飞行等级所对应的飞行条件。其中,长途飞行对发动机造成的磨损相对较大,而短途飞行则对健康状态的影响较小。除上述关键因素外,其他特性对于发动机健康状况的影响显得较为有限,未能形成显著的相关性。图3与图4之间关于飞行周期及飞行等级所揭示的趋势表现出高度的一致性,仅在一些影响力较弱的因素上存在细微差别。这一发现有效验证了Shapley值分析作为一种模型无关解释方法的有效性,无论是在基于神经网络还是集成学习构建的预测模型框架下,该方法都能够一致地识别出影响发动机健康状态的主要因素。
Figure 3. Shapley value distribution based on the M1 model
图3. 基于M1模型的Shapley值分布图
Figure 4. Shapley value distribution based on the M2 model
图4. 基于M2模型的Shapley值分布图
Table 3. Flight level classification
表3. 飞行等级划分
飞行等级 |
飞行时长(小时) |
飞行次数 |
1 |
1~3 |
18 |
2 |
3~5 |
149 |
3 |
>5 |
185 |
3.3.2. HDBSCAN分析
在上述Shapley分析中,我们得知飞行周期是航空发动机健康衰退最重要的因素,并且随着飞行周期的逐渐增加,其健康状态呈现逐渐衰退的趋势,表明了健康与不健康状态之间边界的模糊性,两者间缺乏一个绝对的阈值区分。为深入探究介于这两种明确状态之间的其他潜藏状态,本文采用HDBSCAN算法对样本数据进行聚类分析。旨在识别健康与不健康类别之外的样本群体,并揭示这些样本群内在的分布规律。
为了更为直观地展示聚类结果,本文采用UMAP方法对特征进行降维,UMAP关键参数如表4所示:
Table 4. Key parameter settings for UMAP
表4. UMAP关键参数设置
参数名称 |
参数值 |
最近邻点数量 |
200 |
样本间最小距离 |
0.01 |
嵌入的维度 |
2 |
距离度量方法 |
correlation |
迭代次数 |
500 |
根据上述UMAP方法降维得到低维特征向量UMAP_1和UMAP_2,并采用HDBSCAN算法对测试样本进行聚类,HDBSCAN算法的关键参数如表5所示:
Table 5. Key parameter settings for HDBSCAN
表5. HDBSCAN关键参数设置
参数名称 |
参数值 |
最小样本数 |
200 |
核心点最小邻居数 |
10 |
距离度量方法 |
euclidean |
最近邻方法 |
kd_tree |
HDBSCAN聚类算法应用于低维特征向量的结果如图5所示,揭示了除健康和不健康状态之外存在难以明确分类的航空发动机样本。这一发现支持了随着飞行周期增加,部分发动机表现出介于完全健康与完全不健康之间的过渡状态的观点。然而,图5中显示的簇间边界模糊及较低的内聚性,特别是对于那些分布更为分散的“其他”类别发动机,表明将这些样本归为同一类别并不十分合理,也反映出原始特征信息未能得到充分利用。为此,本研究进一步采用HDBSCAN算法对经Shapley值降维处理后的特征向量进行了聚类分析,其结果见图6。
从图5和图6的对比结果可以看出,图6所呈现的聚类效果更好,类内距离更小,类间距更大,簇之间呈现明确的可分性,能够直观地反映存在潜藏风险的航空发动机群体。此对比结果有效证实了Shapley值对于特征关键信息的有效攫取,同时也表现出该方法在聚类算法中的有效运用。
3.3.3. SkopeRules分析
在上述实验结果中,我们识别出一类具有潜在风险的航空发动机,其特征表现为剩余使用寿命介于健康与不健康状态之间。基于此发现,本研究根据平均剩余使用寿命将航空发动机重新分类为健康、亚健康和不健康三类。为进一步提高模型决策过程的透明度,并直观描述各类别形成的条件,采用SkopeRules方法对这三种健康状态进行规则提取,其结果见图7。所获得的规则集旨在替代原有的神经网络模型,以降低部署成本和推理时间,增强预测模型在实际应用中的可解释性和实用性。
Figure 5. Clustering of engine health status using dimensionality reduction of original features
图5. 基于原始特征降维的发动机健康状态聚类图
Figure 6. Clustering of engine health status based on dimensionality reduction using Shapley values
图6. 基于Shapley值降维的发动机健康状态聚类图
Figure 7. Box plot of remaining useful life for subgroups of engine health status
图7. 发动机健康状态子群的剩余使用寿命箱线图
本文采用Python中的SkopeRules工具对聚类结果进行描述性规则提取,其关键参数设置如表6所示。
Table 6. Key parameter settings for SkopeRules
表6. SkopeRules关键参数设置
参数名称 |
参数值 |
树的最大去重深度 |
3 |
树的数量 |
100 |
最小精确度 |
0.5 |
最小召回率 |
0.5 |
通过SkopeRules对发动机健康状态三大类别提取的规则如表7所示:
Table 7. Rule descriptions for engine health status
表7. 发动机健康状态的规则描述
健康状态 |
规则 |
精确率 |
召回率 |
F1分数 |
健康 |
飞行周期数 ≤ 34.5 飞行等级 ≤ 1.5 |
0.701 |
0.933 |
0.801 |
亚健康 |
飞行周期数 ≤ 36.5 飞行等级 > 1.5 |
0.995 |
0.950 |
0.972 |
不健康 |
飞行周期数 > 36.5 |
0.998 |
0.975 |
0.986 |
从表7可以看出,飞行周期数是决定航空发动机健康状态的关键因素,这与Shapley分析结果一致,验证了其结论的可靠性。当飞行周期数超过36.5时,发动机更易进入不健康状态。由于单个飞行周期内执行的任务类型多样,仅凭飞行周期数难以准确判断发动机健康状况,还需结合飞行等级来辅助识别。较高飞行等级意味着更长的飞行时间和更多班次,加速了发动机的健康退化,从而处于亚健康状态。相对于M1和M2模型的预测精度,在规则集下的健康和亚健康类别的预测精度略有下降,而不健康类别的F1分数保持不变,三类别的F1分数均超过80%。尽管整体分类精度有所牺牲,但三分类提供了更为细致的状态描述,有助于针对不同健康状态制定差异化维护计划,从而提升资源利用效率及维修效果。
4. 结论
本研究提出了一种基于Shapley值的可解释人工智能框架,旨在深入探讨航空发动机健康状态退化机制。通过该框架的应用,实现了对各个因素对航空发动机健康影响的量化评估,揭示了健康衰退机制。研究结果表明,在所有考虑因素中,飞行周期数对发动机健康状态的影响最为显著。此外,研究证实了无论是采用神经网络模型还是基于决策树算法的集成学习模型,运用Shapley值分析所获得的结果均表现出高度一致性。进一步地,将Shapley值与UMAP降维方法及和HDBSCAN聚类算法相结合,有效地从健康发动机中甄别出潜在风险较高的亚健康发动机群体,并通过SkopeRules工具对处于不同健康水平的发动机群体进行规则归纳,明确了飞行周期是区分发动机是否开始进入不健康阶段的关键指标,而飞行等级高低是判断发动机是否维持健康状态或已步入亚健康状态的重要依据。这不仅验证了所提框架在不同预测模型之间具有良好的无关特性,还识别出了发动健康衰退的关键因素,明确了健康衰退过程中的关键转折条件,为实施航空发动机的预防性维护提供了坚实的理论依据。
5. 展望
本文利用N-CMAPSS数据集,评估了基于Shapley值的可解释人工智能框架在航空发动机健康状态预测中的有效性,揭示了发动机退化机理,并加深了对健康衰退过程的理解,从而为实现经济效益的预测性健康管理提供了支持。尽管如此,Shapley值计算的高成本限制了其实用性,且在非线性模型中,其解释力相较于线性模型显得更加抽象。因此,未来的研究需聚焦于提高计算效率及开发更直观的非线性特征解释方法,以促进可解释人工智能技术的发展与广泛应用。
基金项目
中电天奥产业发展基金“风电场智慧运维大数据平台”(202201090404)。