在站点层面预测短期自行车共享需求:一种基于多任务动态图的空间时间方法
【字体:
大
中
小
】
时间:2025年12月04日
来源:Knowledge-Based Systems 7.6
编辑推荐:
针对共享单车供需不平衡问题,提出多任务动态图神经网络(MTDG)模型,通过时间varying语义邻接图捕捉时空动态关联,结合双输入LSTM学习借入与借出需求的交互,并融合气象等全局特征,显著提升站级小时级需求预测精度,在蒙特利尔和纽约数据集上均优于基线方法。
共享单车需求预测是智能交通系统中的关键问题。随着城市交通的数字化转型,实时预测用户出行需求成为优化车辆调度、降低运营成本的核心。本文针对现有模型在空间关联动态性、多任务协同性方面的不足,提出了一种基于动态语义图神经网络的多任务预测框架(MTDG),并在蒙特利尔和纽约的实测数据中验证了其有效性。
### 研究背景与挑战
共享单车服务因地理分布不均和用户行为复杂性,常出现供需失衡。传统方法如ARIMA和SVR虽能捕捉部分时间序列特征,但无法有效整合空间关联性。近年来,图神经网络(GNN)通过构建节点间关系模型,在交通预测中取得进展,但存在三大局限:
1. **静态空间关联**:多数模型依赖地理距离或固定功能相似性定义邻接关系,忽视历史需求动态变化带来的空间关联。
2. **单任务预测**:现有研究多单独预测租车或还车需求,忽略二者在用户行程中的强关联性。
3. **历史数据冗余**:直接使用完整历史数据输入模型虽能捕捉长期规律,但会显著增加计算复杂度,且可能引入噪声干扰。
### 创新方法:MTDG模型架构
#### 空间关联动态建模
核心突破在于构建**时间动态语义邻接图**。通过计算历史3周内各车站的租车和还车需求相似性(Pearson相关系数衡量线性相似性,DTW衡量时间序列对齐相似性),生成每小时的动态邻接矩阵。例如,在雨季某时段,地铁周边站点可能因通勤需求呈现相似波动模式,此时动态图会强化这些站点的连接权重,而忽略地理邻近但需求互补的站点。
#### 多任务协同学习
引入**双输入LSTM**机制,将租车和还车需求预测视为相互关联的任务。例如,某站点租车需求激增,通常伴随周边站点还车需求减少,模型通过共享时空特征提取模块捕捉此类耦合关系。实验表明,联合训练使模型在单任务性能上优于独立训练,同时整体误差降低约18%-25%。
#### 历史特征分层捕捉
从历史数据中提取三类关键特征:
- **邻近性(Closeness)**:当前时段与前后1小时的需求波动关联
- **周期性(Period)**:日、周、月等固定周期模式(如早高峰通勤潮)
- **趋势性(Trend)**:长期上升或下降趋势(如季节性用车偏好)
通过三路并行处理不同时间尺度特征,结合全局气象数据(温度、降水、风速),最终通过全连接层实现多任务预测。
### 实验验证与效果分析
#### 数据集与预处理
采用蒙特利尔BIXI和纽约Citi共享单车数据,筛选出日均需求≥3次的544个活跃站点。数据预处理包括:
- **时空对齐**:按小时粒度聚合需求量,并标准化为0-1范围
- **异常值处理**:剔除连续3小时需求波动超过均值2.5倍的数据点
#### 模型性能对比
在蒙特利尔数据集上,MTDG模型各项指标显著优于基线:
| 模型 | 车站级RMSE(租车) | 车站级RMSE(还车) | MAE(租车) | MAE(还车) |
|---------------------|-------------------|-------------------|-------------|-------------|
| ARIMA | 4.571 | 4.458 | 3.124 | 3.112 |
| LSTM(单任务) | 3.668 | 3.584 | 2.421 | 2.335 |
| **MTDG(最优配置)** | **2.792** | **2.620** | **1.675** | **1.598** |
**关键改进点**:
1. **动态图构建**:相比静态图(如GCN-UP),动态邻接矩阵使模型在雨雪天气等异常条件下仍能保持高精度(如图7所示,暴雨期间预测误差仅上升3.2%)
2. **多任务协同**:联合预测租车与还车需求,MAE误差降低17%-22%
3. **特征融合效率**:通过全连接层而非复杂模块融合,计算量减少40%但精度提升9%
#### 跨城市泛化能力
在纽约曼哈顿数据集验证中,模型同样表现出色:
- 车站级RMSE降至2.84(租车)和2.56(还车)
- 与AGND、STMFFN等先进模型相比,MAE误差减少约12%
- 图8显示,模型能有效捕捉曼哈顿下东区(Downtown Brooklyn)与布鲁克林公园(Brooklyn Bridge Park)之间的跨区需求联动
### 方法论优化路径
1. **多步预测扩展**:计划将当前单步预测架构升级为Transformer-based的**多步预测模型**,通过编码-解码架构实现未来3小时滚动预测
2. **动态权重调整**:引入可学习的时间衰减因子,使模型能自动识别季节性需求衰减规律(如冬季夜间用车率下降23%)
3. **边缘计算适配**:针对共享单车终端设备算力限制,设计轻量化模型架构(参数量减少至原版的35%)
### 行业应用价值
模型可实时输出各车站的供需预测值,为:
- **调度中心**:每5分钟更新预测,动态规划3公里范围内车辆转运路径
- **运维团队**:通过预测结果自动触发预警(如预测误差>15%时启动备用车辆调配)
- **用户端**:APP显示未来1小时各站点供需热力图,辅助用户决策
### 局限与改进方向
1. **数据稀疏性问题**:部分郊区站点日均需求<3次时,模型预测稳定性下降约40%
*改进方案*:采用迁移学习框架,先通过主城区数据预训练,再通过少量样本微调
2. **多模式耦合**:当前仅支持单车系统预测,未来需整合电单车、网约车等多模式数据
3. **可解释性不足**:需开发可视化工具(如图注意力机制)展示预测依据
该研究为共享出行系统提供了从数据采集到决策优化的完整解决方案,其动态图神经网络架构为同类研究提供了新范式。后续将探索与5G车路协同系统的集成应用,实时接入交通信号灯、道路状况等外部数据源,进一步提升预测精度。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号