Prediction of Main Bearing Temperature Anomaly in Wind Turbine Gearbox with Multi-Feature Combination Integration
The main bearing of a wind turbine gearbox operates under high-speed rotation and heavy load conditions, and its temperature abnormality may lead to overheating or increased wear of the bearing, which in turn affects the equipment life. Aiming at the problem that the existing prediction methods do not fully consider the state of the equipment measurement points where the input features of the model are located, this paper proposes a multi-feature combination and integration method for predicting the temperature abnormality of the main bearing of wind turbine gearboxes, to inhibit the influence of the input feature abnormality on the judgment of the state of the main bearing, and to reduce the false alarm rate of the model. Firstly, preprocess historical health data from the Data Acquisition and Supervisory Control System (SCADA), select two sets of measurement points related to the main bearing of the gearbox as feature combinations based on Spearman’s correlation, then establish two Back-Propagation Neural Network (BP) models through training, validation, and testing for evaluating the main bearing temperature, extract temperature residual thresholds and average sliding window step sizes from each model for real-time data analysis, and finally, comprehensively assess the main bearing status for anomalies based on the temperature residuals from the two models. The corresponding temperature residual thresholds and average sliding window steps of each model are extracted for real-time data analysis, and finally the temperature residuals of the two models are used to comprehensively determine whether the state of the main bearing is abnormal or not. An offshore wind farm project example data is used to verify the model performance, and the results show that when the main bearing temperature rises, the proposed method can judge the main bearing temperature abnormality 51.5 hours in advance compared with the traditional SCADA temperature alarm threshold; when the generator winding temperature rises, it can accurately prompt the existence of an abnormal combination of features to avoid the false alarm of the main bearing temperature abnormality.
Wind Turbine
为了应对日趋严峻的气候变化和推动绿色低碳发展,中国在2020年9月明确提出“双碳”目标,即力争2030年前二氧化碳排放达到峰值,努力争取2060年前实现碳中和
齿轮箱是风电机组传动系统的关键部件之一,主要作用于传递和调节机组的转速和扭矩,对发电性能和可靠性十分重要。齿轮箱故障会导致机组无法正常运行,甚至引发重大事故,给风电场和电网造成巨大经济损失。风电机组传动链中轴承多为大型,根据尺寸和工作环境特殊性,通常受局部变形、振动和温升等原因造成轴承损伤。研究表明轴承故障约占齿轮箱故障的21%,及时发现轴承异常、减少故障及维修成本,对机组安全稳定运行至关重要
针对上述问题,本文提出一种基于多特征组合集成的风电机组齿轮箱主轴承温度异常预测方法,旨在抑制输入特征异常的影响,降低主轴承温度异常状态误报率。首先通过Spearman相关性分析从SCADA系统测点表中筛选相关性高的特征,并将这些特征划分为2个独立组合。然后将风电机组健康运行状态下的独立组合特征数据分别作为输入,齿轮箱主轴承温度作为输出,建立基于BP神经网络的温度评估模型,通过一致性投票策略综合判断主轴承温度是否异常。最后,在某海上风电场实例数据中分别验证该方法对风电机组齿轮箱主轴承温升模拟故障和发电机绕组温升模拟故障的判断能力。
为了提高风电机组齿轮箱主轴承温度评估模型的精度并降低训练时间,需要从SCADA测点表中选择与主轴承运行状态相关的特征。传统的特征筛选方法通常使用Pearson相关系数或基于风电场运维工程师经验,但这些方法对数据分布有特殊要求,且受异常值影响较大,并不适用于所有风电机组型号。基于此,本文采用非参数统计方法Spearman相关性分析衡量两个变量之间的单调关系强度。它基于两个变量的秩次而不是原始数值进行计算,因此对于数据的分布没有特殊要求
Spearman相关系数的计算公式如下:
(1)
其中di为每对数据点在两个变量中的秩次差,n为样本数。
BP神经网络通过反向传播算法训练网络权重,用于解决分类和回归等任务。BP神经网络可以有效地学习输入数据中的复杂特征,并被广泛应用于图像识别、自然语言理解、工业故障预测与健康管理
BP神经网络每一层包含多个神经元,通过带权重的连接相互作用,表达式如下:
(2)
(3)
(4)
(5)
其中,H表示隐藏层的输出信息;O是预测的网络输出;Y是目标值;esum是预测误差; 和 是相应的权值; 和 表示相应的偏置;f是隐藏层的激活函数;l和m分别是隐藏节点和输出节点的数量。
在网络的前向传播过程中,输入数据经过隐藏层逐层处理,最终输出预测结果。而在反向传播过程中,通过计算预测输出与目标值之间的误差反向调整网络参数,使网络逐渐优化,提高预测准确性。
一致性投票策略用于处理集成模型中多个模型的输出结果。在这种策略中,每个模型都对样本进行预测,并将预测结果进行比较。如果多个模型的预测结果一致,则最终的集成模型也选择这个结果作为最终输出。
设M1和M2是两个异常检测模型,它们根据输入数据分别产生二元分类结果 ,其中0表示结果正常,1表示异常。定义一致性度量C,根据y1,y2的值确定模型是否一致,如下式所示。当C为1时,表示两个模型都检测到异常。当C为0时,表示两个模型都检测到正常。当C为−1时,表示两个模型结果不一致,提示检查输入数据。
(6)
一致性投票策略的优点在于能够降低模型的误报率,通过多个模型的一致性来提高模型的稳定性和可靠性。
风电机组齿轮箱主轴承温度异常预测流程如
1) 模型训练。首先对SCADA历史健康数据预处理,避免缺失值和离群值对模型性能的干扰。然后对主轴承温度测点和其他测点数据展开Spearman相关性分析,结合现场工程师专家经验提取特征,划分为2个特征组合,并建立特征组合和主轴承温度的数据集。划分数据集,通过训练、验证和测试来建立2个主轴承温度评估BP模型,并确定温度残差异常阈值。
2) 实时预测。首先对SCADA实时数据预处理,按照划分情况将特征值分组输入到2个齿轮箱主轴承温度评估模型,计算温度残差,并与阈值进行比较。当2个模型残差均超出阈值时,判断主轴承温度异常;均未超出阈值时,判断主轴承温度正常;单个模型超出阈值,判断其输入特征组合存在异常。
风电机组齿轮箱主轴承温度异常预测是基于2个BP模型的温度残差与各自阈值比较的综合评价。本文通过平均绝对误差(Mean Absolute Error, MAE)、根均方误差(Root Mean Square Error, RMSE)、决定系数(R-Squared, R2)评估BP模型性能。R2可以衡量回归模型的拟合程度,反映自变量对因变量变化的解释能力,取值范围在0到1之间,越接近1表示拟合程度越好。
(7)
(8)
(9)
式中 和 分别为第i个样本的估计值和实测值, 为实测平均值。
根据验证集温度残差的平均值和3倍标准差设置异常阈值。3倍标准差参照3sigma原则,根据统计学,数据的正常波动范围大约在平均值的正负三个标准差之内,异常值被定义为一组测定值中与平均值偏差超过3倍标准差的值。在实时数据应用中,通过滑动窗口取残差平均进一步抑制噪声干扰,降低异常误报率。
案例研究对象为中国某海上风电场半直驱风电机组A,额定功率为5.5MW,切入风速为3 m/s,切出风速为25 m/s,配置SCADA系统。选取该机组2023年3月17日至5月20日的10分钟SCADA数据训练模型并确定温度残差异常阈值。
SCADA系统采集特征数据时,采用死点检测、重复点检测、异常波动检测处理传感器异常。其中死点检测用于判断传感器在一段时间内是否保持恒定输出值。重复点检测用于识别数据在短时间内反复出现相同值的情况。异常波动检测用于监测数据变化是否超出预期范围。然而受启停机、通讯设备故障等影响,SCADA系统数据中仍夹杂着大量噪声数据,因此在模型训练前需要对数据进行预处理。设置小于切入风速、大于切出风速、有功功率为负以及其他非运行状态时的数据质量为0。其余运行状态时的数据质量为1,用于后续建模。经过处理后的机组A数据质量和齿轮箱主轴承温度如
所选风电机组SCADA系统每组数据包含182个模拟量测点,包括设备温度、压力、电流等信息。对于齿轮箱主轴承温度,大部分测点数据信息冗余。因此通过Spearman相关性分析和专家经验筛选出16个特征,并划分为2个组合,如
组合 |
特征名称 |
相关系数 |
1 |
齿轮箱过滤泵出口压力 |
0.919 |
齿轮箱发电机侧轴承温度 |
0.913 |
|
齿轮箱冷却器入口油温 |
0.892 |
|
齿轮箱主泵出口压力 |
0.850 |
|
齿轮箱油温 |
0.839 |
|
齿轮箱油压力 |
0.814 |
|
齿轮箱冷却器出口油温 |
0.601 |
|
齿轮箱水泵出口温度 |
0.601 |
|
2 |
发电机绕组温度5 |
0.986 |
发电机齿轮箱侧轴承温度 |
0.972 |
|
叶轮转速 |
0.913 |
|
发电机转速 |
0.913 |
|
电网有功功率 |
0.913 |
|
电网电流L1 |
0.905 |
|
风速 |
0.890 |
|
机舱温度 |
0.422 |
经过数据预处理之后的主轴承温度和部分特征如
对数据集进行划分,其中训练集、验证集和测试集分别占总数据集的70%、15%和15%。在划分训练集和验证集后,采用打乱数据的方式按照原始比例进一步划分,确保模型在训练过程中能够充分学习和泛化数据的特征,避免过拟合或欠拟合的问题。为了避免数据泄露问题和确保模型评估的准确性,在训练阶段对训练集数据标准化处理,将验证集和测试集数据在进行预测或评估之前使用相同的标准化参数处理。验证集用来优化超参数,测试集用来评估模型性能。
分别对2个特征组合展开基于BP神经网络的主轴承温度评估模型训练。通过验证集优化,设置BP模型神经网络的隐藏层节点数量为10,学习率为0.001,优化算法为Levenberg-Marquardt,性能函数为均方误差,目标误差为0.001,最大训练迭代次数为2000次。测试集的评估效果如
模型1和模型2的MAE分别为0.2687℃和0.1808℃,RMSE分别为0.3458℃和0.2184℃,R2分别为0.9012和0.9606,表明模型在对主轴承温度进行评估时能够较为准确地捕捉到数据的变化规律和趋势,对实际情况的反映较为精准,具有较高的评估能力。根据验证集,确定模型1和模型2的温度残差异常阈值分别为(−0.8051℃, 0.8057℃)和(−0.4924℃, 0.4651℃)。为抑制噪声干扰,根据测试集,确定模型1和模型2的温度残差平均滑动窗口步长分别为10和12。
由于该海上风电场机组投运时间较短,齿轮箱主轴承暂未发生故障。所选机组在2023年5月24日至28日连续健康运行,采集该时段SCADA系统720组数据,并参照文献方法
该故障可能由润滑不良、负载过大、轴承损坏等原因引起。在齿轮箱主轴承温度的第301个样本序列点处,加入步距为0.05℃的温度偏移得到模拟故障数据。模型1和模型2的评估值和残差值如
模型1在第321个点超过阈值,模型2在第313个点超过阈值,根据集成模型规则,在第321个点判断主轴承温度异常,相对SCADA内置报警阈值75℃提前了309个点,即51.5小时。
以特征组合2中发电机绕组温度测点为例。发电机绕组温升故障可能由电流过载、绕组故障或环境温度过高等原因引起。在特征组合2中发电机绕组温度测点的第301个样本序列点处,加入步距为0.05℃的温度偏移得到模拟故障数据。模型1和模型2的评估值和残差值如
模型2在第351个点超过阈值,模型1全程未超过阈值,根据集成模型规则,判断特征组合2中存在测点异常,主轴承温度正常。
对比齿轮箱主轴承温升故障和发电机绕组温升故障,观察到多特征组合集成模型能较快地预测主轴承异常状态,避免特征测点异常导致的误报。与此同时,兼顾监测特征组合状态,为现场人员定期检查检修划定重点范围,为故障诊断减少工作量。
在所选机组A外,选择机组B验证。模型1和模型2测试集的MAE分别为0.2588℃和0.2424℃,RMSE分别为0.3514℃和0.2937℃,R2分别为0.9255和0.9480。根据验证集,确定模型1和模型2的温度残差异常阈值分别为(−0.8267℃, 0.8350℃)和(−0.6918℃, 0.7067℃),温度残差平均滑动窗口步长分别为11和13。采集该机组连续健康运行时的720组SCADA系统数据,分别模拟齿轮箱主轴承温升故障和发电机绕组温升故障。
齿轮箱主轴承温升故障时,模型1和模型2的评估残差值如
特征组合2中发电机绕组温升故障时,模型1和模型2的评估残差值如
结果表明所提方法适用于不同机组,在不同数据集上的数据处理和特征选择方法依然合理,验证了异常检测结果的可靠性。
针对特征异常对模型的干扰,本文提出了一种基于多特征组合集成的风电机组齿轮箱主轴承温度异常预测方法。对某海上风电场机组SCADA数据预处理和Spearman相关性分析,选择2个特征组合分别建立主轴承温度评估模型,然后通过MAE、RMSE、R2验证了模型评估精度,得到各自温度残差阈值和滑动窗口步长。在实时数据监测时,根据2个模型的预测结果综合判断主轴承温度是否异常。模拟故障测试结果分析表明,所提方法相对SCADA内置温度报警阈值,提前51.5小时预测主轴承温度异常,并且抑制了发电机绕组升温故障对模型的影响,避免了异常误报。
综上所述,本文提出的多特征组合集成方法,通过综合分析多特征组合的温度残差,实现了风电机组主轴承温度异常的早期准确预测,为维护人员提供了更可靠的预警手段,并有效提升了异常检测的鲁棒性。
2022年广东能源集团科技创新“揭榜挂帅”项目“海上风电运维关键技术研究与应用(机组可靠性研究)”。
*通讯作者。