1. 引言
随着国家工业化日益发展,越来越多的使用场景对机械故障的监控和诊断提出了更高要求[1]。轴承作为制造业的关键部件,往往容易出现故障,约有40%的旋转机械故障是由于滚动轴承的问题引起的[2]。因此,为确保旋转机械平稳有效的运行,就必须保证滚动轴承的准确诊断[3]。
当滚动轴承的运行状态发生变化时,会在监测到的振动信号中反应出来。通过采集故障信号,可以对故障问题进行诊断,但故障信号中往往含有强噪声和非线性特征,对于信号的特征提取带来了困难和挑战[4]。所以,必须采用一种先进的信号处理技术来实现对信号特征的提取。国内外很多学者致力于去除原始振动信号中的噪声分量。相较于小波变换,Huang N.E.等[5]提出的经验模态分解(EMD)无需设定基函数,将复杂信号分解为多个信号分量。但EMD在分解过程中存在端点效应、模态混叠等问题,可能会导致分解结果产生错误[6]。王海龙等[7]提出一种改进的互补聚合经验模态分解(CEEMDAN)有效地解决了EMD所存在的部分问题,但也存在计算量过大的问题。Dragomiretskiy等[8]人提出的变分模态分解(VMD)算法则有效地避免了传统方法中常见的端点效应和模态混叠问题。此外,VMD的分解效果受到惩罚因子和模态层等核心参数的影响,需要人为设定模态个数,缺乏自适应性。奇异谱分析(SSA)能够有效分离信号中的噪声,且不需要对信号进行预设模型假设,具有良好的自适应性,使得SSA在处理强噪声和非线性的信号时表现尤为出色。Liu T. [9]将SSA应用于滚动轴承的故障诊断取得了良好的效果。
选取合适的特征向量是特征提取的关键。自信息论提出以来,熵值的应用场景日益广泛,如今也广泛地应用于故障的特征提取[10]。封成东等[11]提出一种基于样本熵的滚动轴承诊断模型,但样本熵(SE)存在运算速度慢参数设置复杂的问题。相较于样本熵,排列熵(PE)具有运算速度快,参数设置少的优点。郭跃楠等[12]通过排列熵提取了轴承的早期微弱故障特征。但排列熵在处理短的时间序列或数据分布不均匀的情况下,会面临较大的误差。针对上述问题,陈剑等[13]将气泡熵与支持向量机相结合,提高了故障诊断的准确度。针对气泡熵在时间序列的复杂性分析中存在不足的问题,提出了复合多尺度气泡熵(CMBE),提高了轴承故障诊断的准确性和稳定性。
随着计算机技术的日益发展,滚动轴承的识别技术也愈发成熟。常见的分类模型有随机森林(RF)、支持向量机(SVM)和极限学习机(ELM)等。ELM与传统神经网络相比,在学习效率方面表现优异,具有较快的学习速度[14]。此外,ELM结构简洁、预测精度高,因而被广泛应用于多个领域[15] [16]。但ELM模型中的阈值与权重是随机生成的[17],泛化性不足,可能会影响识别的准确率。本文采用美洲狮算法(PO)对ELM的输入层节点权重和隐藏层节点阈值进行优化,以提高模型对故障的识别能力。PO优化算法采用了一种新的机制来改变勘探和开发的阶段,实验表明PO的优化效果相较于WOA、PSO、DE等算法都具有更出色的性能。
综合上述内容,本文提出了一种基于SSA-CMBE和PO-ELM的滚动轴承故障诊断方法。首先,使用SSA对故障信号进行分解与重构;接着,运用CMBE提取重构信号的特征;然后,通过PO算法对ELM进行优化,建立PO-ELM模型;最后,通过PO-ELM模型对CMAE特征向量进行故障类型的识别与分类。实验结果表明,PO-ELM模型的故障识别准确率高达99.17%。
2. 信号处理与特征提取
2.1. 奇异谱分析
奇异谱分析(Singular Spectrum Analysis, SSA)是一种处理非线性时间序列数据的方法。近年来常应用于信号处理领域,通过对所要研究的故障信号进行分解、重构等操作得到多个更加准确的IMF分量。奇异谱分析的具体步骤如下。
第一步,需要选择合适的窗口长度L将原始时间序列进行滞后排列得到轨迹矩阵:
(1)
通常情况下取
。令
,则轨迹矩阵X为
的矩阵为:
(2)
第二步,对轨迹矩阵进行奇异值分解,具体来说就是将X分解为以下形式:
(3)
其中U称为左矩阵;Σ仅在主对角线上有值,就是奇异值,其他元素均为零;V称为右矩阵。此外U、V均为单位正交阵,满足
,
。
由于直接分解轨迹矩阵较为复杂,因此首先需要计算轨迹矩阵的协方差矩阵:
(4)
接下来对S进行特征值分解得到特征值
和对应的特征向量
。此时
,
为原序列的奇异谱。并且有:
(5)
这里
对应的特征向量
反映了时间序列的演变型,称为时间经验正交函数(T-EOF)。
将具有相似信号特征的子序列进行叠加,生成表示趋势、周期、半周期和噪声等信号的特定序列,从而完成对原始序列的分解。其重构原理可以通过以下公式表示:
(6)
分组重构的关键在于区分同类信号,在提取特定序列时依据各分量的皮尔逊系数进行划分,并根据贡献度进行重构,贡献度低的子序列认为是噪声,在重构的时候去除这部分子序列。
利用SSA方法对滚动轴承的故障信号进行重构,以提高信噪比,从而更有效地提取其趋势特性和故障特征。
2.2. 皮尔逊相关系数
相关关系指的是两个或多个变量之间的取值存在一定的规律或联系,其目的是揭示数据中的潜在关系网。通过SSA对故障信号进行分解得到若干IMF分量,计算各分量与原始信号的皮尔逊相关系数,计算公式如下:
(7)
其中:
为原始信号;
为各个IMF分量;
分别为数据平均值;n为数据总长度。根据计算的皮尔逊系数,对信号进行重构。
2.3. 复合多尺度气泡熵
2.3.1. 气泡熵
气泡熵(BE)是一种几乎不需要进行参数选择的方法,其具体步骤如下[18]。
1) 对时间序列
进行相空间重构,得到m维重构矩阵S,即:
(8)
(9)
2) 对每个重构分量的元素,从左到右依次按照下面方法进行:左边元素小于右边元素位置不变,反之则交换位置。
3) 画一个关于n (n为交换次数) (
)的直方图,归一化计算得到概率p,求出2阶瑞丽熵,其公式如下:
(10)
(11)
4) 将嵌入维数m增加1,重复以上3个步骤,得到
,计算得到BE,其公式如下:
(12)
2.3.2. 复合多尺度气泡熵
多尺度熵是一种在数据分析中广泛应用的工具,特别是用来衡量时间序列的复杂性。它通过在不同时间尺度上计算熵值,刻画出数据在各个尺度上的复杂性特征,从而揭示出隐藏在数据中的信息。时间尺度的变化有助于我们捕捉数据在不同细节层次上的模式,从而更加全面地理解时间序列的特性。复合多尺度熵在此基础上进一步拓展,通过对粗粒序列的处理,能够更精确地刻画出时间序列的多重复杂性。
通过对粗粒序列的分析,复合多尺度熵可以揭示系统内部不同子系统之间的耦合关系,帮助分析这些子系统在不同时间尺度上的互动模式。这种分析方法不仅可以评估系统的复杂性,还能有效地揭示其同步性,为故障预测和健康监测提供了重要依据。
图1展示了对于红噪声信号在不同尺度下MBE和CMBE值的分布情况。
Figure 1. Distribution of red noise signal
图1. 红噪声信号的分布情况
由图片可以看出,与MBE方法相比,CMBE值变化幅度更小,总体更为平稳,CMBE定量提取特征的稳定性更好。
3. PO-ELM模型
3.1. 美洲狮优化算法
美洲狮优化算法(Puma Optimizer, PO)是一种全新的元启发式算法,其设计灵感来源于美洲狮的生存智慧与行为模式[19]。其算法主要包含无经验阶段、有经验阶段、勘探阶段和开发阶段4部分。
1) 无经验阶段是在算法的前三次迭代中,同时执行探索操作和开发操作,直到在相变阶段完成初始化。在第三次迭代结束后,则只选择勘探和开发阶段的其中一个。主要计算公式如下:
(13)
(14)
在计算
和
的值后,比较大小,如果
大于等于
,则进入开发阶段,否则进入探索步骤。
2) 有经验阶段,美洲狮算法积累了足够的经验来判断是否需要改变阶段。在此阶段,算法只需选择一个阶段来进行优化操作。
(15)
(16)
上式用于计算每个开采和勘探阶段的最终成本,勘探和开采阶段的参数
和
分别根据每个阶段的结果获得。如果勘探阶段函数的成本大于开采函数,则开采函数的参数
的值将以0.01的值线性惩罚,另一方面,开采阶段的参数
值将具有接近1的最大值。但是,如果开采阶段函数的成本高于勘探函数,则上述过程将相反。
3) 勘探阶段,整个种群按升序排序,首先放置高质量的解决方案。在每次迭代中,被新方案替换的维度数量都会增加,如果新的解决方案具有比当前解决方案更好的成本,则它将取代当前解决方案。
4) 在开发阶段,PO算法通过两种不同的算子来优化解,这两种算子分别模拟了美洲狮的两种典型行为:伏击狩猎和快速冲刺。这些行为为算法提供了多样化的改进机制。
(17)
等式(17)显示了PO中使用的两种策略。考虑到在美洲狮中,为了在第一种模式下狩猎,在开发阶段,为了奔跑和伏击策略,使用了等式(17)中的情况1。如果随机生成的rand5值(在0到1之间均匀分布)大于0.5,则采用快速奔跑策略;否则,选择伏击策略。
为了验证PO算法的性能,将PO算法分别与WOA、PSO、DE、GA进行对比,使用几种标准测试函数进行测试,设置迭代次数设为1000,种群数量设为30,得到不同测试函数的收敛曲线如图2所示。可以看到PO相较于其他算法收敛速度更快,并且有更高的优化精度。算法的执行流程如图3所示。
3.2. 极限学习机
ELM (极限学习机)是一种前馈神经网络模型,通过随机初始化输入权值和阈值,进而计算得到相应的输出权值。ELM的输出表达式为:
(18)
式中,
为隐藏层的激活函数,
为第j个输入层的权值向量;
为第j个隐藏层的权值向量;
为第j个隐藏层节点阈值。
4. 基于SSA-CMBE和PO-ELM的故障诊断流程
基于SSA-CMBE和PO-ELM的故障诊断流程如下:
Figure 2. Iteration curves for different standardized test functions
图2. 不同标准测试函数的迭代曲线
Figure 3. PO algorithm flow chart
图3. PO算法流程图
1) 选取转速为1797的4种故障作为输入设备的故障信号。
2) 通过SSA对输入信号进行奇异值分解,得到多个IMF分量,并计算各个分量的皮尔逊相关系数,筛选出相关系数较大的IMF分量进行重构。
3) 计算重构信号的复合多尺度气泡熵,构造CMBE特征。每种故障的CMBE特征120组,4种故障类型,共480组CMBE特征。每种故障类型选取90组CMBE特征作为训练集,其余30组作为测试集,并对其使用标签标记。
4) 采用PO算法优化ELM模型中的输入层到隐藏层的权重w以及隐藏层的偏移值b。设置最大迭代次数T以及种群数量pop,将训练集的错误率作为适应度函数。
5) 设置PO的初始化参数以及加权因子PF用于控制探索和开发之间的平衡。计算种群个体的初始适应度值并进行排序。根据公式计算探索和开发的评分,比较二者值的大小,选择进入开发或者探索阶段,并更新相应的参数和最优解。在每次迭代结束后,重新计算探索和开发阶段的评分。通过对探索和开发两个阶段的动态调整,逐步逼近最优解。
6) 将含有CMBE值特征的训练集导入经过PO算法优化相关参数的ELM模型中进行训练,并使用测试集预测轴承的故障情况,进行分类,最后根据标签验证分类的准确率。基于SSA-CMBE和PO-ELM故障诊断的流程图如图4所示。
5. 实验分析
5.1. 滚动轴承数据集获取
本文实验数据集选用美国凯斯西储大学轴承数据中心实验室[20]采集的滚动轴承信号用来进行算法的搭建以及模型验证。
5.2. 故障特征提取
通过SSA方法对内圈故障、滚动体故障、外圈故障三种故障信号以及正常信号进行奇异值分解得到多个IMF分量,图5为内圈故障信号的分解得到的八个分解信号图。
Figure 4. Fault diagnosis flowchart
图4. 故障诊断流程图
Figure 5. Inner ring fault SVD decomposition signal time-domain waveform
图5. 内圈故障SVD分解信号时域波形
计算每个IMF分量与原始信号的皮尔逊相关系数,内圈故障、滚动体故障、外圈故障的皮尔逊相关系数如表1所示。
Table 1. Pearson correlation coefficients of each component
表1. 各分量皮尔逊相关系数
|
IMF1 |
IMF2 |
IMF3 |
IMF4 |
IMF5 |
IMF6 |
IMF7 |
IMF8 |
内圈故障 |
0.8542 |
0.8629 |
0.6905 |
0.8465 |
0.5639 |
0.3771 |
0.2759 |
0.0880 |
滚动体故障 |
0.9298 |
0.9496 |
0.3236 |
0.6116 |
0.4388 |
0.2972 |
0.1629 |
0.0502 |
外圈故障 |
0.9708 |
0.9870 |
0.6892 |
0.6119 |
0.1475 |
0.0910 |
0.1310 |
0.0947 |
对每种故障分量的相关系数值进行排序,可以观察到每组排名前六分量的皮尔逊系数值明显高于后两个分量,因此选取排名前六的IMF分量作为有效分量。计算每组有效分量的MBE和CMBE,其熵值分布图如图6所示,并将复合多尺度气泡熵作为特征向量。与MBE相比,生成多个粗粒序列再计算多个序列多尺度熵的CMBE更能体现出故障信号间的差异,从而更好地区分不同的故障类型。
Figure 6. Entropy distribution of different vibration signals
图6. 不同振动信号的熵值分布情况
5.3. 算法寻优比较
探讨了PO-ELM模型在诊断效果中的应用,重点比较了PO、WOA、PSO和DE四种优化算法在ELM模型的权值和阈值优化中的表现。实验表明,PO算法在适应度曲线的收敛速度和最小值方面表现最优,明显优于其他三种算法(WOA、PSO和DE)。这一结果验证了PO-ELM模型在提升诊断效果方面的显著优势,指出了PO算法在优化过程中相对于其他寻优算法的优势。各优化算法的适应度曲线如图7所示。
5.4. 故障诊断结果分析
首先,通过SSA对内圈故障、滚动体故障、外圈故障三种故障信号以及正常信号进行重构,再计算重构信号的气泡熵、MBE和CMBE作为特征向量,对于每种特征向量,每种信号分别选择90组作为训练集,30组作为测试集,样本的具体分布情况如表2所示。
将带有标签的以气泡熵、MBE和CMBE作为特征向量的训练集导入PO-ELM模型进行训练,并通过测试集验证结果,四种故障类型下的平均准确率分别为95%、98.33%和99.17%,PO-ELM模型的诊断结果分别如图8的(a)~(c)所示。因此,CMBE作为特征向量的特征提取效果要优于MBE和BE。
Figure 7. Fitness curves of different optimization algorithms
图7. 不同优化算法的适应度曲线
Table 2. Fault code and sample size distribution
表2. 故障编码及样本数分布
故障编码 |
故障类型 |
训练集样本数 |
测试集样本数 |
1 |
正常状态 |
90 |
30 |
2 |
内圈故障 |
90 |
30 |
3 |
滚动体故障 |
90 |
30 |
4 |
外圈故障 |
90 |
30 |
为了进一步验证PO-ELM模型特征提取的性能,将常见的故障诊断优化模型与之进行对比,选取WOA-ELM、PSO-ELM和DE-ELM模型三种优化模型。将带有标签的CMBE特征数据集分别导入PSO-ELM、WOA-ELM和DE-ELM模型进行故障诊断,四种故障类型下的平均准确率分别为94.17%、95.83%和94.17%。三种模型的诊断结果如图9所示。
为保证模型的预测准确率,将以上六种方法多次实验求平均值,并对测试结果的准确率进行汇总,如表3所示。由图可知,CMBE相较于MBE和BE有更好的特征提取性能,对于后续导入模型进行训练和诊断,其在故障识别的准确率方面有明显的提高。此外,将CMBE作为特征向量导入ELM时,使用PO算法优化ELM的识别准确度相较于PSO、WOA和DE算法更高。结果显示,采用SSA-CMBE方法进行特征提取,并利用PO算法优化ELM的权值和阈值,所构建的综合故障诊断模型在识别滚动轴承
Figure 8. PO-ELM model diagnosis results
图8. PO-ELM模型诊断结果
故障时展现出更高的精度和有效性。
6. 结论
针对滚动轴承特征提取效果不佳以及故障诊断精度不足的问题,提出了基于SSA-CMBE和PO-ELM的故障诊断方法。得到的结论如下:
1) 通过SSA算法对故障信号进行重构,提升振动信号的信噪比,并将重构后的信号计算其CMBE值,作为信号的特征向量,相比较于传统的熵值,CMBE可以更精准地提取滚动轴承的故障特征。
2) 选择PO算法优化极限学习机,解决了ELM权值和阈值的随机生成问题从而提高了分类的精度,构建了PO-ELM的故障诊断模型。
3) 将带有CMBE特征向量的训练集导入诊断模型进行训练和测试,分别与PSO、WOA和DE算法
Figure 9. Diagnosis results of three fault diagnosis models
图9. 三种故障诊断模型诊断结果
Table 3. Comparison of results from different fault diagnosis algorithms
表3. 不同故障诊断算法结果对比
故障状态 |
故障 标签 |
测试集识别数量 |
BE-PO-ELM |
MBE-PO-ELM |
CMBE-PO-ELM |
CMBE-PSO-ELM |
CMBE-WOA-ELM |
CMBE-DE-ELM |
正常状态 |
1 |
29 |
30 |
30 |
29 |
29 |
29 |
内圈故障 |
2 |
30 |
30 |
29 |
30 |
30 |
30 |
滚动体故障 |
3 |
24 |
28 |
30 |
25 |
27 |
24 |
外圈故障 |
4 |
30 |
30 |
30 |
30 |
30 |
30 |
诊断准确率(%) |
94.17% |
98.33% |
99.17% |
95% |
96.67% |
94.17% |
优化ELM的模型结果相对比,实验结果表明本文提出的基于SSA-CMBE和PO-ELM的故障诊断模型有更高的识别准确度,可更为精确地监测滚动轴承存在的故障,并保证轴承的平稳运行。
基金项目
国家自然科学基金资助项目(42174189, 61572084)。