准确、可靠的短时客流预测对于城市轨道交通的运营管理至关重要,能为运营管理者提供优化决策的依据,从而改善乘客服务质量和提升交通运营效率。文章基于数据驱动的方法,对北京地铁连续5周25个工作日的自动售票系统(Automatic Fare Collection,简称AFC)刷卡数据进行了详细的分析。通过对AFC数据的清洗和预处理,提取15 min时间粒度的进站客流时间序列并进行归一化处理。采用图卷积神经网络(Graph Convolutional Network,简称GCN)和二维卷积神经网络(Convolutional Neural Network,简称CNN)的组合模型对客流进行预测,模型输入为周模式、日模式、实时模式三个模式下的短时进站客流序列,综合考虑不同时间尺度上的客流变化。为验证模型的有效性和预测的精度,选用真实的北京地铁客流数据集进行实例分析,并运用均方根误差、决定系数、平均绝对误差、加权平均绝对百分误差等评估指标评估客流预测精度。结果表明,与传统的单一模型相比,GCN-CNN组合模型的准确性和精度均取得了显著的提高。 Accurate and reliable short-term passenger flow prediction is crucial for the operation and management of urban rail transit, providing the basis for operational managers to optimize decision-making, thereby improving passenger service quality and enhancing transport efficiency. This paper presents a detailed analysis of card swipe data from the Automatic Fare Collection (AFC) system of the Beijing Metro for 25 consecutive working days over 5 weeks. After cleaning and preprocessing the AFC data, time series of inbound passenger flow with 15-minute granularity is extracted and normalized. The combined model of Graph Convolutional Network (GCN) and 2D Convolutional Neural Network (CNN) is utilized for passenger flow prediction, with inputs including short-term inbound passenger flow sequences in weekly, daily, and real-time modes, comprehensively considering passenger flow changes at different time scales. To verify the validity and accuracy of the model, a real Beijing metro passenger flow dataset is analyzed, utilizing evaluation metrics such as root mean square error, coefficient of determination, average absolute error, and weighted average absolute percentage error. The results demonstrate significant improvements in accuracy and precision compared to traditional single-model approaches.
准确、可靠的短时客流预测对于城市轨道交通的运营管理至关重要,能为运营管理者提供优化决策的依据,从而改善乘客服务质量和提升交通运营效率。文章基于数据驱动的方法,对北京地铁连续5周25个工作日的自动售票系统(Automatic Fare Collection,简称AFC)刷卡数据进行了详细的分析。通过对AFC数据的清洗和预处理,提取15 min时间粒度的进站客流时间序列并进行归一化处理。采用图卷积神经网络(Graph Convolutional Network,简称GCN)和二维卷积神经网络(Convolutional Neural Network,简称CNN)的组合模型对客流进行预测,模型输入为周模式、日模式、实时模式三个模式下的短时进站客流序列,综合考虑不同时间尺度上的客流变化。为验证模型的有效性和预测的精度,选用真实的北京地铁客流数据集进行实例分析,并运用均方根误差、决定系数、平均绝对误差、加权平均绝对百分误差等评估指标评估客流预测精度。结果表明,与传统的单一模型相比,GCN-CNN组合模型的准确性和精度均取得了显著的提高。
城市轨道交通,短时客流预测,深度学习,组合模型
Shule Yuan*, Xiaofeng Liu, Jiamin Shi
School of Automotive and Transportation, Tianjin University of Technology and Education, Tianjin
Received: Apr. 10th, 2024; accepted: May 17th, 2024; published: May 31st, 2024
Accurate and reliable short-term passenger flow prediction is crucial for the operation and management of urban rail transit, providing the basis for operational managers to optimize decision-making, thereby improving passenger service quality and enhancing transport efficiency. This paper presents a detailed analysis of card swipe data from the Automatic Fare Collection (AFC) system of the Beijing Metro for 25 consecutive working days over 5 weeks. After cleaning and preprocessing the AFC data, time series of inbound passenger flow with 15-minute granularity is extracted and normalized. The combined model of Graph Convolutional Network (GCN) and 2D Convolutional Neural Network (CNN) is utilized for passenger flow prediction, with inputs including short-term inbound passenger flow sequences in weekly, daily, and real-time modes, comprehensively considering passenger flow changes at different time scales. To verify the validity and accuracy of the model, a real Beijing metro passenger flow dataset is analyzed, utilizing evaluation metrics such as root mean square error, coefficient of determination, average absolute error, and weighted average absolute percentage error. The results demonstrate significant improvements in accuracy and precision compared to traditional single-model approaches.
Keywords:Urban Rail Transit, Short-Term Passenger Flow Prediction, Deep Learning, Combinatorial Model
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
随着城市化进程的推进和人口规模的持续扩张,城市轨道交通凭借其容量大、准点率高、速度快等特点成为大型城市中的重要交通工具 [
近年来,城市轨道交通系统的短时客流预测逐渐成为智慧城市交通领域的重要研究方向。这一领域的发展经历了数理统计模型、机器学习模型以及深度学习模型三个阶段的演进。首先,早期的短时客流预测主要依赖于基于数理统计的模型。包括历史平均模型、最小二乘法、卡尔曼滤波模型等 [
本文的研究目标是基于历史AFC (Automatic Fare Collection)数据,选用15 min作为时间粒度,从中提取出基于时间序列的进站客流信息,以预测未来15分钟内城市轨道交通线网的进站客流量。为了更有效地利用客流量的周期性,本研究采用了三种时间模式进行预测,包括周模式、日模式和实时模式。在模型设计方面,本研究将图卷积神经网络(GCN)与二维卷积神经网络(CNN)相结合,提出了GCN-CNN组合模型。GCN层通过处理不同时间尺度的客流数据,揭示了交通模式随时间演变的多尺度依赖性。这些时间维度的特征经过融合后,CNN层进一步提取这些融合特征中的空间特征,通过其深层的非线性处理能力来捕捉站点间复杂的空间依赖关系。同时为了防止过拟合,在模型的全连接层之间添加两个Dropout层,在卷积层后进行批量归一化。综上所述,本文提出的GCN-CNN组合模型,在一定程度上提高了客流预测的准确性和模型的泛化能力,能够综合考虑城市轨道交通系统在时空维度上的复杂特征。
搭建基于GCN-CNN的短时客流预测模型,模型框架如图1所示。通过结合GCN和CNN的优势,此模型不仅能够有效处理具有复杂空间结构的图数据,还能捕捉时间序列数据的动态变化 [
模型建立步骤如下:
步骤一:数据输入
现有地铁短时客流预测模型中的数据输入分为两类:一是以天(d)为单位,不分时段,将所有历史数据都作为输入;二是将一天分为不同的时段,再把每天的同一时段的客流作为数据的输入 [
步骤二:图卷积神经网络(GCN)层
将上文中的三种客流分别输入GCN层,通过定义三个独立的GCN层来处理不同的时间尺度(周、日、实时)的流量数据,模型能够分别学习每个时间尺度上的空间依赖性。周尺度GCN层:专注于学习周内模式,捕捉周末与工作日之间的流量差异等周期性变化。日尺度GCN层:关注日内模式,如早晚高峰时段流量的变化。实时尺度GCN层:用于捕捉更细粒度的时间变化,例如每小时的流量波动。通过GCN层处理,不仅能够同时捕捉不同时间尺度的流量模式,提高预测的准确性和鲁棒性,还能有效学习站点间的空间依赖关系,提高了空间特征的表示能力。
步骤三:卷积神经网络(CNN)层
GCN层输出的三种客流经过合并之后输入CNN层,卷积神经网络(CNN)能从复杂数据中自动提取多维度特征 [
图1. GCN-CNN模型框架图
由于城市轨道交通数据的获取通常受限制,从轨道运营企业获得数据可能会面临一系列挑战。常规渠道可能需要经过繁琐的审批程序,耗费大量时间和精力。考虑到城市轨道交通数据的稀缺性和获取的难度,实验数据为论文中开源的北京客流数据,该数据包括北京连续5周的客流数据。本文使用2016年2月29日~2016年4月1日连续5周25个工作日的AFC数据,共计1.3亿条数据。数据跨度为05:00~23:00 (18 h),将前四周的数据作为训练集,训练集的10%作为验证集,第五周的数据作为测试集 [
在利用构建的模型进行轨道站点短期客流预测时,模型的参数设置需要根据具体模型考虑的因素来确定 [
参数 | 取值 | 参数含义 |
---|---|---|
time_interval | 15 | 时间粒度 |
time_lag | 10 | 使用的历史时间步 |
tg_in_one_day | 72 | 一天内有多少个时间步 |
forecast_day_number | 5 | 预测的天数 |
is_train | 默认True | 是否获取训练集 |
is_val | 默认Flase | 是否获取验证集 |
val_rate | 0.1 | 验证集所占比例 |
pre_len | 1 | 预测未来时间步 |
表1. 模型的主要参数设置
1) XGBoost (eXtreme Gradient Boosting)是一种高效且灵活的梯度提升决策树算法,广泛用于分类、回归、预测和排序任务。在短时客流、路网行驶速度和汽车流量等预测工作中都有涉及 [
2) 随机森林(Random Forest)是一种集成学习模型,由Leo Breiman和Adele Cutler于2001年提出。它是一种基于决策树的集成模型,通过构建多个决策树并对其结果进行组合来进行预测 [
3) LSTM (长短时记忆网络)适用于处理时间序列性数据,对预测时间序列中的长间隔和延迟有很好的处理效果 [
4) GCN (图卷积神经网络)被用于处理图数据,提取节点特征,并进行节点分类等任务。学习率设置为0.001,BatchSize = 32。
5) CNN (卷积神经网络):二维卷积神经网络,卷积核尺寸3 × 3,池化核尺寸2 × 2,Dropout层设置0.5的概率。
均方根误差(root mean square error, RMSE)对于一些异常值比较敏感,可以直观表示预测值与真实值的平均偏离程度.RMSE值越小,表明预测值与真实值越接近,预测模型的性能越好。RMSE可计算为:
RMSE = 1 n ∑ i = 1 n ( y i − y 1 ^ ) 2
决定系数(Coefficient of Determination),通常用符号R2表示,是一种用于衡量回归模型拟合优度的统计指标。它表示因变量的变异程度中可以由自变量解释的比例。决定系数的取值范围从0到1,越接近1表示模型对观测数据的拟合程度越好。
计算决定系数的公式如下:
R 2 = 1 − ( S S R S S T )
其中:
SSR (Sum of Squares of Residuals)表示残差平方和,是观测值与回归模型预测值之间的差异的平方和。
SST (Total Sum of Squares)表示总平方和,是观测值与观测值均值之间的差异的平方和。
平均绝对误差(Mean Absolute Error, MAE)可直观反映平均误差值大小,计算公式为:
MAE = 1 n ∑ i = 1 n | ( y i − y 1 ^ ) |
其中, y i 为真实值; y 1 ^ 为预测值;n为样本个数,MAE值越小,表明模型性能越好。
加权平均绝对百分比误差(WMAPE)是一种用于衡量预测模型准确性的指标,与MAE类似但考虑了每个样本的权重。其计算公式为:
WMAPE = 1 ∑ i = 1 n ω i ∑ i = 1 n ω i | y i − y 1 ^ y i | × 100 %
其中 ω i 表示第i个样本的权重, y i 为真实值; y 1 ^ 为对第i个样本的预测值,n为样本个数。WMAPE值越小,表明模型的预测性能越好。
本文考虑历史客流对客流预测的影响,以北京市地铁的客流数据为例,并利用周模式、日模式、实时模式三种模式来预测各个车站未来15 min的进站客流量。同时采用常用的XGBoost模型、随机森林、LSTM、GCN、CNN模型作为对比,并用RMSE (均方根误差)、R2(决定系数)、MAE (平均绝对误差)、WMAPE (加权平均绝对百分误差)等评估指标综合评价本文模型的预测精度与模型鲁棒性等,结果表2所示。其中GCN-CNN组合模型的训练损失图如图2所示。
各模型预测结果精度如表2所示。
评价指标 Model | RMSE | R2 | MAE | WMAPE |
---|---|---|---|---|
XGBoost | 43.462 | 0.986 | 24.434 | 0.092 |
Random Forest | 69.658 | 0.964 | 42.141 | 0.158 |
LSTM | 54.875 | 0.978 | 31.545 | 0.119 |
CNN | 48.740 | 0.982 | 27.574 | 0.104 |
GCN | 47.485 | 0.983 | 26.920 | 0.101 |
GCN-CNN | 36.219 | 0.990 | 20.941 | 0.079 |
表2. 线网的评价指标对比
图2. GCN-CNN组合模型的训练损失曲线图
GCN-CNN模型相较于其他模型的提升情况如下:
相较于XGBoost,GCN-CNN在:RMSE上提升了16.67%;R2上提升了0.41%;MAE上提升了14.30%;WMAPE上提升了14.13%;
相较于随机森林,GCN-CNN在:RMSE上提升了48.00%;R2上提升了2.70%;MAE上提升了50.31%;WMAPE上提升了50.00%;
相较于LSTM,GCN-CNN在:RMSE上提升了34.01%;R2上提升了1.23%;MAE上提升了33.60%;WMAPE上提升了33.61%;
相较于CNN,GCN-CNN在:RMSE上提升了25.69%;R2上提升了0.81%;MAE上提升了24.06%;WMAPE上提升了24.04%;
相较于GCN,GCN-CNN在:RMSE上提升了23.73%;R2上提升了0.71%;MAE上提升了22.21%;WMAPE上提升了21.78%;
通过对比这些指标,得出以下结论:GCN-CNN模型在处理复杂数据结构,特别是城市轨道交通线网数据时,展现出了显著的性能优势。相比于传统的机器学习模型(XGBoost、随机森林)和其他先进的深度学习模型(LSTM、CNN、GCN),GCN-CNN在关键性能指标上均实现了显著的提升。这包括预测精度(通过RMSE衡量)、模型拟合能力(通过R2衡量)、平均预测误差(通过MAE衡量)以及误差的相对大小(通过WMAPE衡量)。
图3. 不同车站的XGBoost预测对比图
为了更全面地评价GCN-CNN模型的性能,以及对比不同模型之间的差异,随机选择三个车站进行深层分析。三个车站的选择基于随机抽样的原则,目的是确保研究结果的广泛适用性和客观性。随机抽样是科学研究中常用的方法,有助于减少选择偏差,确保样本的代表性。但是随机选择的局限性可能影响模型评估的全面性。因此,未来的研究可以考虑采用聚类后抽样等更细致的方法,以覆盖更广泛的车站类型和运营条件,进一步验证GCN-CNN模型的适用性和优越性。
在之前数据处理中已经把车站进行编号,现在随机抽取车站4,车站18,车站30来展示不同车站在不同模型下的预测变化。下面是三个车站在不同预测模型下的真实值与预测值对比图。如图3~8所示。
XGBoost模型下三个车站的真实值与预测值对比图如图3所示。
随机森林模型下三个车站的真实值与预测值对比图如图4所示。
LSTM模型下三个车站的真实值与预测值对比图如图5所示。
CNN模型下三个车站的真实值与预测值对比图如图6所示。
图4. 不同车站的随机森林预测对比图
图5. 不同车站的LSTM预测对比图
图6. 不同车站的CNN预测对比图
GCN模型下三个车站的真实值与预测值对比图如图7所示:
图7. 不同车站的GCN预测对比图
GCN-CNN模型下三个车站的真实值与预测值对比图如图8所示:
图8. 不同车站的GCN-CNN预测对比图
为了更直观地展示模型预测性能,并深入了解模型在各个车站预测准确度的差异,对每个车站进行对比分析,如表3所示:
Station | Station 4 | Station 18 | Station 30 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
指标 | RMSE | R2 | MAE | WMAPE | RMSE | R2 | MAE | WMAPE | RMSE | R2 | MAE | WMAPE |
XGBoost | 42.087 | 0.992 | 27.479 | 0.072 | 53.127 | 0.990 | 33.847 | 0.075 | 19.422 | 0.983 | 14.409 | 0.101 |
Random Forest | 58.129 | 0.982 | 39.967 | 0.104 | 114.367 | 0.954 | 70.772 | 0.157 | 21.791 | 0.979 | 17.125 | 0.117 |
LSTM | 47.464 | 0.988 | 30.630 | 0.080 | 86.312 | 0.974 | 47.905 | 0.106 | 18.509 | 0.985 | 14.716 | 0.101 |
CNN | 46.200 | 0.988 | 29.496 | 0.077 | 63.543 | 0.986 | 39.538 | 0.088 | 20.489 | 0.981 | 29.496 | 0.077 |
GCN | 43.169 | 0.989 | 29.053 | 0.076 | 72.982 | 0.981 | 41.733 | 0.093 | 19.197 | 0.983 | 14.435 | 0.101 |
GCN-CNN | 41.386 | 0.991 | 25.565 | 0.067 | 37.533 | 0.995 | 26.535 | 0.059 | 15.997 | 0.988 | 12.245 | 0.085 |
表3. 单个车站的评价指标对比
可以看出,GCN-CNN模型在单个车站的表现普遍优于其他基准模型。归因于GCN-CNN模型结合了图卷积网络(GCN)和卷积神经网络(CNN)的优势,有效地捕获了数据的空间特征和时序依赖,从而提高了预测的准确性。
本文通过结合图卷积神经网络(GCN)和卷积神经网络(CNN)提出了一个针对城市轨道交通短时客流的预测模型。通过详细分析北京地铁的自动售票系统数据,得出本文提出的GCN-CNN模型在预测准确性和模型泛化能力上表现优异。首先,GCN层通过捕捉交通模式的多尺度依赖性,有效的处理了不同时间尺度上的客流变化。其次,CNN层使得模型能够深入挖掘并利用站点间的复杂空间依赖关系,从而提高预测的准确性和精度。GCN-CNN模型在多个关键性能指标上,均显示出GCN-CNN模型在这些指标上表现出较好的性能。具体而言,GCN-CNN模型展现出较低的RMSE和MAE值,表明其具有较高的预测准确性,而较高的R2值则说明其具备较强的解释能力。相较于基准模型,GCN-CNN模型展现出更好的性能和鲁棒性,进一步验证了其在处理复杂非线性数据和利用空间关系与时间序列信息方面的优势。
天津市科技计划(XC202028, 2022ZD016)项目资助。
袁淑乐,刘晓锋,石佳敏. 基于GCN-CNN模型的轨道交通短时客流预测Short-Term Passenger Flow Prediction in Rail Transit Based on GCN-CNN Model[J]. 交通技术, 2024, 13(03): 182-191. https://doi.org/10.12677/ojtt.2024.133022
http://kns.cnki.net/kcms/detail/50.1190.U.20231208.1721.004.html, 2024-03-27.
https://doi.org/10.1109/TITS.2020.3000761