针对风力发电数据噪音多、波动大等特点,本文提出了基于注意机制的VMD-BiLSTM超短期风力发电预测模型。首先,对数据进行变分模态分解,降低序列的非平稳性和强非线性;其次,将各子模态固定在同一时间滑动窗口上,分别使用BiLSTM进行进一步的双向序列特征提取,然后引入注意机制,加强重要特征信息的影响,提高模型的最终预测效果。最后通过NREL网站的美国西南地区的发电数据集来进行验证,最终结果显示,无论是从预测的准确性还是评判指标方面,本文所提出的模型在风力发电预测上都优于其他5类模型。 Aiming at the characteristics of large noise and large fluctuations in wind power generation data, an attention mechanism-based VMD-BiLSTM ultra-short-term wind power generation prediction model is proposed. Firstly, the data is decomposed using the variational mode (VMD) to reduce the se-quence non-stationarity and strong nonlinearity. Secondly, each sub-mode is fixed on the sliding window at the same time, and BiLSTM is used to further extract bidirectional sequence features, and then the attention mechanism is introduced to strengthen the influence of important feature information and improve the final performance of the model. Finally, the power generation data set in the Southwest of the United States on the NREL website was verified. The final results show that the model proposed in this paper is superior to the other 5 models in terms of wind power predic-tion accuracy and evaluation indicators.
针对风力发电数据噪音多、波动大等特点,本文提出了基于注意机制的VMD-BiLSTM超短期风力发电预测模型。首先,对数据进行变分模态分解,降低序列的非平稳性和强非线性;其次,将各子模态固定在同一时间滑动窗口上,分别使用BiLSTM进行进一步的双向序列特征提取,然后引入注意机制,加强重要特征信息的影响,提高模型的最终预测效果。最后通过NREL网站的美国西南地区的发电数据集来进行验证,最终结果显示,无论是从预测的准确性还是评判指标方面,本文所提出的模型在风力发电预测上都优于其他5类模型。
风力发电,注意力机制,变分模态分解,双向长短期记忆网络,超短期预测
Wenwu Deng1, Yongmei Ding2*
The School of Science, Wuhan University of Science and Technology, Wuhan Hubei
Received: Dec. 19th, 2022; accepted: Jan. 11th, 2023; published: Jan. 30th, 2023
Aiming at the characteristics of large noise and large fluctuations in wind power generation data, an attention mechanism-based VMD-BiLSTM ultra-short-term wind power generation prediction model is proposed. Firstly, the data is decomposed using the variational mode (VMD) to reduce the sequence non-stationarity and strong nonlinearity. Secondly, each sub-mode is fixed on the sliding window at the same time, and BiLSTM is used to further extract bidirectional sequence features, and then the attention mechanism is introduced to strengthen the influence of important feature information and improve the final performance of the model. Finally, the power generation data set in the Southwest of the United States on the NREL website was verified. The final results show that the model proposed in this paper is superior to the other 5 models in terms of wind power prediction accuracy and evaluation indicators.
Keywords:Wind Power, Attention Mechanisms, Variational Modal Decomposition, Bidirectional Long Short-Term Memory Network, Ultra-Short-Term Forecasting
Copyright © 2023 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
在当今错综复杂的全球背景之下,极端天气的频发,新冠肺炎不断肆虐,部分国家冲突不断升级,使得生态能源、资源也面临着巨大压力和不确定性。风能作为一种高效、清洁的可再生能源,在世界各地得到了广泛的应用,并且在未来的全球发展中起着至关重要的作用 [
目前,电力预测主要包括传统的差分整合移动平均自回归模型(ARIMA),机器学习中的XGBoost、逻辑回归、支持向量机等模型,以及深度学习中的循环神经网络(RNN)、长短期记忆神经网络(LSTM)、门控循环单元(GRU)和注意力机制等。对于ARIMA模型,模型要求数据是平稳的,且这个模型在本质上只能捕获序列中的线性关系 [
针对上述问题,本文提出了基于注意力机制的VMD-BiLSTM的混合模型。针对原始风力发电数据的固有特性,本文使用变分模态分解,既降低了数据的复杂度也保证了其完整性,同时也解决了模态混叠的问题,随后将分解后的各个子模态输入BiLSTM模型中,为了能更好的学习序列的前后规律,再将各个输出作为注意力机制的输入,进一步学习数据特征,并赋予BiLSTM模型对不同序列重要性的隐性权重,最终进行训练和预测,并且其他单一模型和混合模型比较,证明了该模型具有更好的预测效果,更加具有普适性。
变分模态分解(VMD)是一种能够将新型非平稳信号、序列进行自适应分解的一种模态分解方法 [
假设将原始信号f分解为k个分量,保证分解序列为中心频率带宽有限的模态分量,且各模态估计带宽之和最小,约束条件为所有模式的总和等于原始信号 [
min { u k , ω k } { ∑ k ‖ ∂ t [ ( δ ( t ) + j π t ) ∗ u k ( t ) ] e j ω k t ‖ 2 2 } (1)
s .t . ∑ k u k = f (2)
其中,f为原始信号, u k = { u 1 , u 2 , ⋯ , u k } 为各模态的 ω k = { ω 1 , ω 1 , ⋯ , ω k } 为各模态中心频率,
( δ ( t ) + j π t ) ∗ u k ( t ) 为希尔伯特变换下的解析信号, δ ( t ) 为脉冲信号函数, e j ω k t 是对解析信号进行指数修正, ‖ ∂ t [ ( δ ( t ) + j π t ) ∗ u k ( t ) ] e j ω k t ‖ 2 2 是对信号进行高斯平滑调整(即L2范数的平方根),从而得到每个模态
函数的带宽描述。 ∂ t 是求该二范数的梯度,这里使用二范数是防止模型过拟合 [
针对上述的约束最优化问题,将约束变分问题转变为非约束变分问题,使用了增广Lagrangian函数 [
L ( { u k } , { ω k } , λ ) = α ∑ k ‖ ∂ t [ ( δ ( t ) + j π t ) ∗ u k ( t ) ] e j ω k t ‖ 2 2 + ‖ f ( t ) − ∑ k u k ( t ) ‖ 2 2 + 〈 λ ( t ) , f ( t ) − ∑ k u k ( t ) 〉 (3)
其中, α 为惩罚参数, λ 为拉格朗日乘子。
相应的模态分量 u k 、 ω k 中心频率的更新公式如下:
u k n + 1 ( ω ) = f ( ω ) − ∑ i = 1 , i ≠ k k u i ( ω ) + λ ( x ) 2 1 + 2 α ( ω − ω k ) 2 (4)
ω k n + 1 = ∫ ∞ ω | u k n + 1 ( ω ) | 2 d ω ∫ ∞ | u k n + 1 ( ω ) | 2 d ω (5)
其中, ω 为频率, f ( x ) 、 λ ( x ) 、 u k n + 1 分别为 f ( t ) 、 λ ( t ) 、 u k n ( t ) 的傅里叶变换。
VMD整体步骤如下:
1) 初始化参数,模态数k,带宽限制、噪声容忍度、频域表达式 { u k } ,中心频率 { ω k } ,拉格朗日乘子 λ 等;
2) 根据公式更新模态分量 u k 和中心频率 ω k ;
3) 利用公式 λ n + 1 ( ω ) = λ n ( ω ) + τ ( f ( ω ) − ∑ k n + 1 u k ( ω ) ) 更新 λ n + 1 ;
4) 设置停止迭代条件,退出循环,然后返回步骤(2),最终得到分解后的模态,完成模态分解。
长短期记忆网络(LSTM)模型将隐藏层中的神经元替换成了具有长短期记忆的神经元,还增加了三个门控单元,包括遗忘门、输出门和输入门,从而有效的解决了之前模型的长期依赖问题 [
图1. 长短期记忆网络流程图
具体公式如下:
输入门: I t = sigmoid ( W i [ H t − 1 , x t ] + b i ) (6)
遗忘门: F t = sigmoid ( W f [ H t − 1 , x t ] + b f ) (7)
候选记忆: C ˜ t = sigmoid ( W c [ H t − 1 , x t ] + b c ) (8)
更新状态单元: C t = F t ∗ C t − 1 + I t ∗ C ˜ t (9)
输出门: O t = sigmoid ( W o [ H t − 1 , x t ] + b 0 ) (10)
输出: H t = O t ∗ tanh ( C t ) (11)
上式中的 W i 、 W f 、 W c 、 W o 分别为各个门的权重, b i 、 b f 、 b c 、 b 0 分别为各个门的偏置项, σ 为激活函数 [
BiLSTM模型的具体结构是由两层相同的LSTM模型构成,且两层的神经元数量相等。首先,将正向的数据输入向前LSTM单元,得到向前LSTM单元的输出,类似的,再将数据反向输入向后LSTM单元,得到向后输出,最后将向前和向后的输出结果按照一定的权重线性叠加,从而得到最终的输出结果 [
注意力机制可以看作模拟人脑注意力活动的一个行为 [
图2. 双向长短期记忆网络流程图
图3. 注意力机制流程图
将BiLSTM隐藏层输出向量 H = { h 1 , h 2 , ⋯ , h n } 作为注意力机制的输入,再通过公式计算出相应的权重 α n ,如等式所示 [
e i = tanh ( W h h i + b n ) , e i ∈ [ − 1 , 1 ] (13)
α i = exp ( e i ) ∑ i = 1 t exp ( e i ) , ∑ i = 1 t α i = 1 (14)
其中 e i 注意力得分,即上一时刻状态与本时刻输出的相似性; W h 为权重矩阵, h i 、 b i 为权重和偏置 [
h ′ i = α i ⋅ h i (15)
最后将注意力向量与不同时间段输入得到的隐状态向量线性映射后相加得出最终的预测值。
相比与原始序列,变分模态分解能够将整个序列分为多个子模态,解决了数据中存在随机性和非线性等问题 [
本文模型流程如图4所示,其算法设计步骤如下:
1) 将原始数据序列进行初始数据检查,包括缺失值、重复值的查找及补全等。
2) 随后对序列数据进行变分模态分解,在经过多次实验后,最终本文发现变分模态分解超参数选择为k = 6,二次惩罚因子 α = 7000 ,将序列分解为6个子模态能较好的提升模型的整体预测能力。
3) 将变分模态分解之后得到的子模态作为BiLSTM的输入,不同子模态分别输入不同的网络单元,并通过前向和后向的网络进一步学习序列的相关性特征,最终以隐状态的形式输出,进一步作为注意力机制的输入。
4) 在注意力机制中,隐状态行向量与注意力向量线性映射相加后再通过全连接层便可得出每个子模态的预测值 [
图4. 模型预测流程图
本文评价指标为平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)。公式如下:
MAE = 1 n ∑ i = 1 n | y ^ i − y i | (16)
MAPE = 100 % n ∑ i = 1 n | y ^ i − y i y i | (17)
RMSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 (18)
式中, y ^ i 为预测值, y i 表示真实值,n为预测点数目,上述指标越小,则表明模型预测结果越接近真实值 [
本文数据来源于National Renewable Energy Laboratory (NREL),为美国西南地区的风力发电数据,本文选取的数据区间为2020年1月1日至2020年2月29日,该数据集一共包含了三台风机,每日数据点以每小时为单位,每台风机包含1440条数据。本文针对其中风机编号为303的发电机组为实验对象。通过训练集和测试集的划分,训练集有1224组数据,测试集中包含216条数据。由于数据量庞大,故只选取了部分数据进行展示,如图5所示,其中横轴为时间,纵轴为发电量。随后查看数据的统计信息,随后进行缺失值的查找和补全,本文是运用均值对缺失值进行补全。
图5. 部分原始序列数据情况
由于模型超参数较多,为了保证实验的客观性,故将不同模型的超参数均设为同一标准,具体设置结果如表1所示。
超参数 | 超参数调试 |
---|---|
VMD模态分解个数K | 6 |
滑动窗口大小 | 80 |
训练集测试集划分比例 | 0.85 |
批量大小 | 32 |
隐藏层神经元个数 | [32, 64] |
训练轮数 | 120 |
表1. 实验参数设置
在处理完数据的基础之上,对303号风机的数据进行变分模态分解,具体情况如图6所示。
图6. 风机303的变分模态分解情况
采用VMD方法对数据进行降噪处理,提取出数据中的特征规律。通过图6可见,共将模态分解为6个IMF,模态1的波动频率相对较低,反应出风力发电的波动性。其余模态都为高频模态,在一定程度上体现了风力发电的随机性。从中心模态可以看出6个中心模态都不处于同一个频率上,这也防止了模态分量混叠的问题。
将变分模态分解后的各个分量模态进行不同模型的预测,以VMD-LSTM、VMD-BiLSTM-Attention模型预测为例,VMD-BiLSTM-Attention模型对模态1和模态2预测情况如下图7、图8所示,总体分量具体预测情况如下表。
从图7、图8中可以看出,模态1和模态2的预测果都较好,而且从表2、表3中也可以看出,VMD-BiLSTM-Attention模型在对每个子模态下的预测结果大多优于VMD-LSTM模型。
图7. VMD-BiLSTM-Attention对模态1的预测
图8. VMD-BiLSTM-Attention对模态2的预测
风机编号 | 模型 | 模态数 | MAE/kW | RMSE/kW | MAPE/% |
---|---|---|---|---|---|
303 | VMD-LSTM | IMF1 | 0.45 | 0.54 | 0.02 |
IMF2 | 1.01 | 1.28 | 0.09 | ||
IMF3 | 1.16 | 1.38 | 0.55 | ||
IMF4 | 0.39 | 0.47 | 0.01 | ||
IMF5 | 0.20 | 0.26 | 0.65 | ||
IMF6 | 0.13 | 0.17 | −1.30 |
表2. VMD-LSTM对各个模态预测
风机编号 | 模型 | 模态数 | MAE/kW | RMSE/kW | MAPE/% |
---|---|---|---|---|---|
303 | VMD-BiLSTM-Attention | IMF1 | 0.61 | 0.77 | 0.02 |
IMF2 | 4.16 | 4.68 | 0.12 | ||
IMF3 | 1.01 | 1.32 | 0.58 | ||
303 | VMD-BiLSTM-Attention | IMF4 | 0.39 | 0.47 | 0.01 |
IMF5 | 0.25 | 0.30 | 0.65 | ||
IMF6 | 0.17 | 0.22 | −1.28 |
表3. VMD-BiLSTM-Attention对各个模态预测
本文首先通过变分模态分解,再通过不同模型对各个模态分别进行预测,最后将各个模态预测的结果进行平均,从而得到最终的预测结果。下表4、表5为编号303风机是否采用VMD分解预测的效果,以此来证明VMD的可行性。最后本文针对风机303的数据采用了6种模型进行预测,并分析其预测的具体结果,如下表5所示。
风机编号 | 模型 | MAE/kW | RMSE/kW | MAPE/% |
---|---|---|---|---|
303 | LSTM | 50.08 | 58.39 | 0.05 |
RNN | 47.54 | 54.81 | 0.05 | |
GRU | 48.81 | 56.02 | 0.04 | |
MLP | 48.74 | 56.44 | 0.04 | |
BiGRU-Attention | 48.59 | 55.86 | 0.7 | |
BiLSTM-Attention | 48.53 | 55.89 | 0.04 |
表4. 未采用VMD对编号303的数据预测
风机编号 | 模型 | MAE/kW | RMSE/kW | MAPE/% |
---|---|---|---|---|
303 | VMD-LSTM | 13.69 | 18.35 | 0.11 |
VMD-RNN | 13.15 | 17.09 | 0.11 | |
VMD-GRU | 15.65 | 19.90 | 0.10 | |
VMD-MLP | 13.26 | 16.80 | 0.10 | |
VMD-BiGRU-Attention | 15.21 | 19.73 | 0.11 | |
VMD-BiLSTM-Attention | 12.62 | 16.85 | 0.11 |
表5. 采用VMD对编号303数据预测
从表4和表5的对比可以看出,对于6个模型来说,在使用变分模态分解之后,无论是MAP还是RMSE都有很大的下降,在对数据使用变分模态分解之后,6个预测模型的MAP分别下降了36.39、34.39、33.16、35.48、33.38、35.91,MAPE分别下降了40.03、37.72、36.12、39.64、36.12、39.03。可见在运用变分模态分解之后能够较大的减少模型预测的误差,同时也提升了模型的预测精度。由上述分析我们能够清楚发现,本文所提出的VMD-BiLSTM-Attention预测模型的实际预期效果一般都要好于文中其他模型,其次预测效果较好的是VMD-GRU、VMD-BiGRU-Attention、VMD-RNN、VMD-MPL,最后是VMD-LSTM。
为了更加直观的展示结果,下图9将6种模型对于风机303的预测结果进行比较,从下图9可以看出,6种模型都对实际数据进行了预测,虽然风力发电数据的波动较大,噪音多,但是通过训练后的模型仍然能够很好的抓取数据中的大部分特征,而且从图中还可以看出,在波峰处模型预测的效果要好于波谷处。
图9. 风机303整体预测情况
最后,为了独立论证本文提出的VMD-BiLSTM-Attention模型的预测效果,下图10为303号风机的原始发电数据与本文所提出的模型预测的数据对比。
图10. 模型VMD-BiLSTM-Attention的预测情况
从图10可以看出,VMD-BiLSTM-Attention模型较为精准的预测了风力发电数据,而且能够较好的捕获数据规律特征,从上表5的误差指标中可知,无论是预测精度还是误差方面,本文提出的模型都优于其他模型,最后可得,本文提出的VMD-BiLSTM-Attention模型在风力发电领域有较大的应用潜力。
本文提出的VMD-BiLSTM-Attention模型,通过NREL网站的美国西南部地区的电力数据集进行验证,得到如下结论:
通过实验可知,同一数据、同一模型在使用变分模态分解之后,其MAE和MAPE分别能够下降30%~40%。这一方法不但降低了数据和原始模型的复杂度,同时也证明了变分模态分解在本文的可行性,随后输入BiLSTM和注意力机制,通过不断的实验,提出了最终的预测模型,最终发现,在同一数据和实验参数下,无论是与单一的神经网络模型还是本文的混合模型相比,本文使用的VMD-BiLSTM-Attention在预测精度方面都高于其他模型,表明该模型在风力发电预测方面有较好的效果,同时也为风力发电预测领域提供了相应的理论参考价值。
在接下来的研究中,可以选取特征变量丰富的数据,例如包含气象条件的特征变量数据;对超参数的选择,通过网格搜索等方法来选择超参数,进一步优化模型。
湖北省教育厅科学研究计划指导性项目(B2022001)。
邓文武,丁咏梅. 基于注意力机制的VMD-BiLSTM风力发电预测VMD-BiLSTM Wind Power Prediction Based on Attention Mechanism[J]. 应用数学进展, 2023, 12(01): 153-165. https://doi.org/10.12677/AAM.2023.121019
https://doi.org/10.1002/2475-8876.12135
https://doi.org/10.1016/j.jclepro.2019.118447
https://doi.org/10.3389/fenrg.2022.920835
https://doi.org/10.1109/TSP.2013.2288675
https://doi.org/10.3390/su14148705
https://doi.org/10.1109/TPWRS.2019.2963109
https://doi.org/10.1016/j.energy.2022.124750
https://doi.org/10.1109/ACCESS.2019.2923006