多数短时交通量的预测研究仅集中在单步预测上,并且预测时长不足,为使得交通管理与控制等措施发挥更好的效果,提高短时交通量多步预测精度,最大限度提高交通管理决策和出行决策合理性,本文提出一种基于Bi-LSTM模型进行短时交通量多步预测。首先利用Bi-LSTM模型进行单步预测,将得到的预测值与原始值替换,通过递归迭代进行五步的多步长预测。根据本文研究结果表明:Bi-LSTM模型在多步预测中具有一定优势,相比于ARIMA模型和BP神经网络模型,其平均多步RMSE、MAE、MAPE、RMSRE分别降低了11.1085和9.4134、9.7884和7.2474、26.52%和14.91%、25.01%和14.95%。最后得出,Bi-LSTM在交通量多步预测上具有较大优势。 Most short-term traffic volume forecasting studies only focus on single-step forecasting, and the forecasting time is insufficient. In order to make traffic management and control measures play a better role, improve the accuracy of multi-step forecasting of short-term traffic volume, and maximize the rationality of traffic management decision-making and travel decision-making, this paper proposes a multi-step forecasting of short-term traffic volume based on Bi-LSTM model. Firstly, Bi-LSTM model is used for single step prediction, the predicted value is replaced with the original value, and the five-step multi-step prediction is carried out by recursive iteration. According to the results of this study, Bi-LSTM model has certain advantages in multi-step prediction. Compared with ARIMA model and BP neural network model, The average multi-step RMSE, MAE, MAPE and RMSRE decreased by 11.1085 and 9.4134, 9.7884 and 7.2474, 26.52% and 14.91%, 25.01% and 14.95%, respectively. Finally, it is concluded that Bi-LSTM has a great advantage in multi-step traffic volume prediction.
多数短时交通量的预测研究仅集中在单步预测上,并且预测时长不足,为使得交通管理与控制等措施发挥更好的效果,提高短时交通量多步预测精度,最大限度提高交通管理决策和出行决策合理性,本文提出一种基于Bi-LSTM模型进行短时交通量多步预测。首先利用Bi-LSTM模型进行单步预测,将得到的预测值与原始值替换,通过递归迭代进行五步的多步长预测。根据本文研究结果表明:Bi-LSTM模型在多步预测中具有一定优势,相比于ARIMA模型和BP神经网络模型,其平均多步RMSE、MAE、MAPE、RMSRE分别降低了11.1085和9.4134、9.7884和7.2474、26.52%和14.91%、25.01%和14.95%。最后得出,Bi-LSTM在交通量多步预测上具有较大优势。
短时交通量多步预测,双向长短时记忆网络,Bi-LSTM
Hongrui Xiang, Zeyu Ruan*, Wei Cao, Yaqi Xiao, Xiaotian Kou, Yongxiang Li
School of Information Science and Engineering, Chongqing Jiaotong University, Chongqing
Received: Apr. 4th, 2024; accepted: May 16th, 2024; published: May 31st, 2024
Most short-term traffic volume forecasting studies only focus on single-step forecasting, and the forecasting time is insufficient. In order to make traffic management and control measures play a better role, improve the accuracy of multi-step forecasting of short-term traffic volume, and maximize the rationality of traffic management decision-making and travel decision-making, this paper proposes a multi-step forecasting of short-term traffic volume based on Bi-LSTM model. Firstly, Bi-LSTM model is used for single step prediction, the predicted value is replaced with the original value, and the five-step multi-step prediction is carried out by recursive iteration. According to the results of this study, Bi-LSTM model has certain advantages in multi-step prediction. Compared with ARIMA model and BP neural network model, The average multi-step RMSE, MAE, MAPE and RMSRE decreased by 11.1085 and 9.4134, 9.7884 and 7.2474, 26.52% and 14.91%, 25.01% and 14.95%, respectively. Finally, it is concluded that Bi-LSTM has a great advantage in multi-step traffic volume prediction.
Keywords:Multi-Step Prediction of Short Time Traffic Volume, Bidirectional Long Time Memory Network, Bi-LSTM
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
近几年,随着经济持续增长,车辆保有量不断增加,交通拥堵情况日趋严重。为了缓解和治理此类现象,短时交通量 [
随着深度学习的发展,人们意识到单向LSTM模型在处理序列数据时存在信息获取的局限性。因此,Alex Graves [
为了加强污水处理过程监控和故障的检测,肖红军(2016) [
顾溢(2019) [
姜猛等(2019) [
孙弋,梁兵涛(2021) [
陈波(2022) [
韩玉银(2023) [
根据上述综述可以得出,预测技术在智能交通系统、污水处理、中文命名实体识别、河流水质管理和海上交通管理等领域得到了广泛的应用和发展。特别是深度学习技术的应用,如Bi-LSTM模型,可以有效地提高预测精度和促进多步预测技术的进步。
在短时交通流中进行递归多步预测 [
图1. Bi-LSTM算法流程图
尽管直接多步预测方法操作简单,但是却需要建立多个模型,不仅增加了计算和维护,而且没有考虑不同时间步的依赖关系;递归多步预测方法,模型复杂度较低,只需建立一个可迭代使用的单步预测模型,但随着预测步数增大,误差会明显增大;直接递归混合多步预测方法,综合递归和直接策略克服了单个方法的局限性,但是建立多个模型仍会增加前期计算和后期维护负担;多输出预测,虽然前期计算和后期维护成本较低,但是模型的构建十分复杂(表1)。综上,本文最终选用递归多步方法对交通量进行多步预测。
方法 | 优点 | 缺点 |
---|---|---|
直接多步预测 | 操作简单 | 建立多个模型,计算和维护难度上升, 没有考虑不同时间步的依赖关系 |
递归多步预测 | 模型复杂度较低,只须建立一个 可迭代使用的单步预测模型 | 误差随预测步数增加而增大 |
直接递归混合多步预测 | 综合递归策略和直接策略 克服单个策略的局限性 | 建立k个模型仍然会增加 前期计算和后期维护负担 |
多输出预测 | 前期计算和后期维护成本较低 | 模型构建复杂 |
表1. 不同预测模型的对比
针对短时交通量多步长预测的问题,相较于长短时记忆神经网络(LSTM),双向长短时记忆模型(Bi-LSTM)能够通过前后两个单向的LSTM连接来同时学习过去与未来时刻的时间序列数据特征,其独立的两个LSTM隐藏层处理正向和反向的时间序列数据,在训练时可以更加全面地学习变量间的相互关系,这提高了数据的利用率,更好地利用了时间序列的时间特征。
LSTM模型的内部结构有四个不同的组成部分,即输入门、遗忘门、记忆单元和输出门 [
图2. LSTM模型结构图
其工作原理分为以下三个步骤:
1) 对输入的短时交通量数据进行预选处理(保留或遗弃)
通过遗忘门读取 h t − 1 和 x t ,给每个在细胞状态中的数字输出一个在[0, 1]间的数值。其中0表示丢弃1表示保留。为控制遗忘门行为的权重矩阵,最终通过遗忘门获得的结果如下所示:
f t = σ ( A f m t − 1 + B f x t + b f ) (1)
式中 f t 表示t时刻需要遗忘的数据函数, σ 表示sigmoid函数, A f 表示 m t 各门控单元的权值矩阵, m t − 1 表示隐藏状态, B f 表示 x t 门控单元的权值矩阵, x t 表示t时刻的输入向量, b f 各门控单元的偏置参数。
2) 进行数据的保留和选择
通过Sigmoid和tanh进行新值的确定。处理后的交通流数据通过Sigmoid将新数据信息存放在细胞状态中,进而决定更新值。而tanh层会创建一个新候选值向量,将其加入到状态中,最后进行更新。
i t = σ ( A i m t − 1 + B i x t + b i ) (2)
c ¯ t = tanh ( A c m t − 1 + B c x t + b c ) (3)
式中 A i 、 A c 表示各门控单元的权值矩阵, B i 、 B c 表示 x t 各门控单元的权值矩阵, b i 、 b c 表示各门控单元的偏置参数。
3) 进行数据新的替换和更新
记忆块单元的状态由过去时刻状态和当前时刻状态共同决定,其中过去时刻状态是由过去时刻单元
的状态与被遗忘的开关单元的输出结果根据相应的元素相乘而得到的,而当前时刻状态是由当前时刻单元的状态与输入的当前时刻开关单元根据相应的元素相乘而得到。具体表达形式如下:
c t = c t − 1 ∘ f t + i t ∘ c ¯ t (4)
式中 f t 表示遗忘门控单元, i t 输入门控单元 c t 最终确定的数值。
在LSTM的基础上,结合输入在两个方向上的交通流信息,对于t时刻输出,前向LSTM具有t时刻及t时刻之前的交通流信息,后向LSTM具有t时刻及t时刻之后的交通流信息,在训练时,对模型进行双向预测,最后将得到的两个结果融合作为输出。其模型结构图如图3所示。
图3. BI-LSTM模型结构图
其计算方法如下所示:
h t ( 1 ) = LSTM ( x t , h t − 1 ( 1 ) ) (5)
h t ( 2 ) = LSTM ( x t , h t − 1 ( 2 ) ) (6)
式中: h t ( 1 ) 、 h t ( 2 ) 表示t时刻正向LSTM网络的隐藏层状态, x t 表示t时刻的输入, h t − 1 ( 1 ) 、 h t − 1 ( 2 ) 表示 t − 1 时刻状态正向LSTM网络的隐藏层状态。
将两部分隐藏层状态 h t ( 1 ) 和 h t ( 2 ) 组合,从而构成网络整体隐藏状态以上为Bi-LSTM的基本结构及原理,它由两个LSTM神经网络组成,具体操作过程与LSTM模型保持一致,每一步结束后,双向进行训练过程的特征提取,得到最终预测结果。
短时交通量数据来源于重庆某主干道路的路口,数据统计间隔为5 min。通过数据预处理方法对数据进行缺失值替换,标准化处理后,对数据集进行划分,将数据集分划成两部分,一部分作为训练集,一部分作为测试集,通常情况下将大约2/3~4/5的样本用于训练,所以本文以8:2的比例划分训练数据集和测试数据集。划分的结果如图4所示。
图4. A进口道短时交通量时间序列
为了更好地评估Bi-LSTM模型的预测效果,本文选取平均绝对误差(MAE, Mean Absolute Error)、平均绝对百分比误差(MAPE, Mean Absolute Percent Error)、均方根误差(RMSE, Root Mean Squared Error)和相对均方根误差(RMSRE, Root Mean Squared Error Relative)作为本文的评价指标,当MAE、MAPE、RMSE和RMSRE的值越小,则该模型预测误差越小,即模型越精确。
其计算式如下所示:
MAE = 1 n ∑ i = 1 n | y i − y ^ i | (7)
MAPE = 1 n ∑ i = 1 n | y i − y ^ i y i | (8)
RMSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 (9)
RMSRE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 y ¯ (10)
本文运用Bi-LSTM模型对短时交通量数据进行多步预测研究,对于Bi-LSTM模型,参数主要分为两类,一类是模型自动拟合的参数,另一类是通过测试算法优化获得的参数。该模型所需的超参数众多且较为复杂,这些超参数会在一定程度上影响模型预测效果,现阶段,一般通过试算法或经验法对这部分超参数进行调整。本文激活函数选择tanh函数,目标函数为RMSE,优化函数为adam函数,用来衡量Bi-LSTM网络的性能,预测结果如图5。
为证明Bi-LSTM模型的预测优势,本文选取两种模型作为对比,分别为ARIMA模型 [
(a) A进口道单步预测
图5. Bi-LSTM模型的多步预测结果
(a) A进口道单步预测
图6. ARIMA模型的多步预测结果
(a) A进口道单步预测
图7. BP神经网络模型的多步预测结果
预测步数 | RMSE | MAE | MAPE | RMSRE |
---|---|---|---|---|
k = 1 | 1.8537 | 1.6013 | 6.11% | 16.95% |
k = 2 | 1.9169 | 1.6251 | 6.46% | 18.03% |
k = 3 | 2.0202 | 1.6575 | 6.86% | 19.39% |
k = 4 | 2.0985 | 1.6857 | 7.32% | 21.05% |
k = 5 | 2.1067 | 1.6930 | 7.46% | 21.13% |
表2. Bi-LSTM模型多步预测指标
预测步数 | RMSE | MAE | MAPE | RMSRE |
---|---|---|---|---|
k = 1 | 11.1997 | 8.3418 | 17.32% | 25.03% |
k = 2 | 12.1807 | 8.9165 | 18.29% | 25.00% |
k = 3 | 13.7003 | 10.7656 | 33.88% | 49.39% |
k = 4 | 13.9909 | 10.9440 | 46.98% | 51.05% |
k = 5 | 14.4669 | 9.9739 | 50.33% | 71.13% |
表3. ARIMA模型多步预测指标
预测步数 | RMSE | MAE | MAPE | RMSRE |
---|---|---|---|---|
k = 1 | 11.4453 | 8.9349 | 21.56% | 33.97% |
k = 2 | 11.4260 | 8.9101 | 21.57% | 33.93% |
k = 3 | 11.4080 | 8.8908 | 21.61% | 33.94% |
k = 4 | 11.4009 | 8.8916 | 21.99% | 34.73% |
k = 5 | 11.3830 | 8.8722 | 22.02% | 34.72% |
表4. BP神经网络模型多步预测指标
分别选取ARIMA模型和BP神经网络模型这两个模型的多步长预测结果与Bi-LSTM模型的多步长预测结果进行对比,能进一步体现Bi-LSTM模型的优越性。这三种模型的评价指标结果分别见表2~4。
由上述结果可以看出Bi-LSTM模型在短时交通量多步预测研究中预测结果较好,其在本文采用的四个评价指标的平均值分别为:RMSE = 1.9992,MAE = 1.6525,MAPE = 6.84%,RMSRE = 19.31%,均小于ARIMA模型和BP神经网络模型的平均评价指标结果。说明Bi-LSTM模型的预测结果更加精确,表明双向长短时记忆网络Bi-LSTM模型的自身特性针对短时交通量这种非线性数据有较好的预测效果。不同模型评价指标折线对比如图8所示。
图8. 不同模型评价指标折线对比图
同时,随着预测步长的增加,多步预测的误差趋势也随之平稳缓慢增加,第五步时的预测误差最大。其他两种模型也出现了这种结果。该结果表明:在多步长预测中,第一步预测对短时交通量数据的预测能力最强,预测效果也最好,第二步至第五步短时交通量数据预测值和实际交通量数据的差值存在逐渐变大的趋势。
本文对重庆某主干道路的路口的交通量数据进行分析研究。在确定性预测的基础上又进行了多步长预测的分析研究,利用Bi-LSTM模型的正反两层LSTM在时间维度上考虑前向和后向的双向时间序列,挖掘时间序列过去与未来数据之间的联系,使得多步预测更加准确和可靠。
将Bi-LSTM模型应用在交通量多步长预测中,并与ARIMA模型,BP神经网络模型进行对比,分析误差指标发现Bi-LSTM在交通量多步预测上具有较大优势,对未来交通状态的研判提供了更多支持。
全国大学生创新创业训练项目,项目编号:X202310618004。
向鸿锐,阮泽宇,曹 微,肖亚琪,寇笑天,李永翔. 基于Bi-LSTM模型的短时交通量多步预测研究Research on Multi-Step Forecast of Short-Term Traffic Based on Bi-LSTM Model[J]. 交通技术, 2024, 13(03): 141-152. https://doi.org/10.12677/ojtt.2024.133018
https://doi.org/10.1016/S0968-090X(00)00039-5
https://doi.org/10.48550/arXiv.1507.01526
https://doi.org/10.27739/d.cnki.gjsgy.2022.000323
https://doi.org/10.13546/j.cnki.tjyjc.2019.23.007