論文の概要: Network-Constrained Policy Optimization for Adaptive Multi-agent Vehicle Routing
- arxiv url: http://arxiv.org/abs/2510.26089v1
- Date: Thu, 30 Oct 2025 02:49:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.636488
- Title: Network-Constrained Policy Optimization for Adaptive Multi-agent Vehicle Routing
- Title(参考訳): 適応型マルチエージェント車両ルーティングのためのネットワーク制約ポリシ最適化
- Authors: Fazel Arasteh, Arian Haghparast, Manos Papagelis,
- Abstract要約: 我々は、協調型ネットワーク対応フリートナビゲーションのためのマルチエージェント強化学習(MARL)フレームワークを通じて、動的車両ルーティングに対処する。
本稿ではまず、各交差点エージェントがローカルトラフィックと近隣状態に基づいてルーティングガイダンスを提供する分散MARLモデルであるAdaptive Navigation(AN)を提案する。
大規模ネットワークにおけるスケーラビリティ向上のために,エージェントを鍵交点(ハブ)のみに割り当てるANの拡張である階層型ハブベース適応ナビゲーション(HHAN)を提案する。
合成格子と実際の都市マップ(トロント、マンハッタン)の実験では、ANは平均走行時間をSPFと比較し、学習ベースラインを減らし、100%のルーティング成功を維持している。
- 参考スコア(独自算出の注目度): 1.4273866043218153
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Traffic congestion in urban road networks leads to longer trip times and higher emissions, especially during peak periods. While the Shortest Path First (SPF) algorithm is optimal for a single vehicle in a static network, it performs poorly in dynamic, multi-vehicle settings, often worsening congestion by routing all vehicles along identical paths. We address dynamic vehicle routing through a multi-agent reinforcement learning (MARL) framework for coordinated, network-aware fleet navigation. We first propose Adaptive Navigation (AN), a decentralized MARL model where each intersection agent provides routing guidance based on (i) local traffic and (ii) neighborhood state modeled using Graph Attention Networks (GAT). To improve scalability in large networks, we further propose Hierarchical Hub-based Adaptive Navigation (HHAN), an extension of AN that assigns agents only to key intersections (hubs). Vehicles are routed hub-to-hub under agent control, while SPF handles micro-routing within each hub region. For hub coordination, HHAN adopts centralized training with decentralized execution (CTDE) under the Attentive Q-Mixing (A-QMIX) framework, which aggregates asynchronous vehicle decisions via attention. Hub agents use flow-aware state features that combine local congestion and predictive dynamics for proactive routing. Experiments on synthetic grids and real urban maps (Toronto, Manhattan) show that AN reduces average travel time versus SPF and learning baselines, maintaining 100% routing success. HHAN scales to networks with hundreds of intersections, achieving up to 15.9% improvement under heavy traffic. These findings highlight the potential of network-constrained MARL for scalable, coordinated, and congestion-aware routing in intelligent transportation systems.
- Abstract(参考訳): 都市道路網における交通渋滞は、特にピーク期間中に、旅行時間が長くなり、排気量が増加する。
ショート・パス・ファースト(SPF)アルゴリズムは、静的ネットワーク内の1台の車両に最適であるが、動的で複数車両の設定では性能が悪く、同じ経路に沿って全車両をルーティングすることで渋滞を悪化させる。
我々は、協調型ネットワーク対応フリートナビゲーションのためのマルチエージェント強化学習(MARL)フレームワークを通して、動的車両ルーティングに対処する。
まず、各交差点エージェントがルーティング誘導を行う分散MARLモデルであるAdaptive Navigation(AN)を提案する。
(i)地方交通
(II)グラフ注意ネットワーク(GAT)を用いてモデル化した地域状態。
大規模ネットワークにおけるスケーラビリティ向上のために,エージェントを鍵交点(ハブ)のみに割り当てるANの拡張である階層型ハブベースの適応ナビゲーション(HHAN)を提案する。
車両はエージェントコントロールの下でハブからハブへルーティングされ、SPFはハブ領域内のマイクロルーティングを処理する。
ハブ調整のため、HHANはAttentive Q-Mixing (A-QMIX)フレームワークの下で、分散実行(CTDE)による集中的なトレーニングを採用し、注意による非同期車両決定を集約する。
ハブエージェントは、局所的な混雑とプロアクティブルーティングの予測ダイナミクスを組み合わせたフロー認識状態機能を使用する。
合成格子と実際の都市マップ(トロント、マンハッタン)の実験では、ANは平均走行時間をSPFと比較し、学習ベースラインを減らし、100%のルーティング成功を維持している。
HHANは数百の交差点を持つネットワークにスケールし、大交通量で最大15.9%の改善を実現している。
これらの知見は,インテリジェント交通システムにおけるネットワーク制約型MARLのスケーラビリティ,コーディネート,混雑を考慮したルーティングの可能性を明らかにするものである。
関連論文リスト
- An LLM-Powered Cooperative Framework for Large-Scale Multi-Vehicle Navigation [10.549493962440804]
マルチサイクルダイナミックナビゲーションは、進化する交通条件の下で大きな船隊を同時にルーティングする必要がある。
既存の経路探索アルゴリズムと強化学習手法は、都市全体のネットワークにスケールするのに苦労する。
大規模多車両ナビゲーションのための階層型LLMフレームワークであるCityNavを提案する。
論文 参考訳(メタデータ) (2025-10-09T06:14:29Z) - Neighbor-Aware Reinforcement Learning for Mixed Traffic Optimization in Large-scale Networks [1.9413548770753521]
本稿では,交差する交差点を横断する混在トラフィックを調整するための強化学習フレームワークを提案する。
我々の重要な貢献は、RVがネットワーク間のバランスの取れた分散を維持することができる隣り合わせの報酬メカニズムである。
その結果,最先端の単一断面制御方式と比較して平均待ち時間を39.2%削減できることがわかった。
論文 参考訳(メタデータ) (2024-12-17T07:35:56Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号システム(TSCS)は、効率的な車両の流れを育むインテリジェントな交通管理に不可欠である。
本稿では,インテリジェントトラフィックエッジネットワークを実現するための新しいTSCSフレームワークを提案する。
我々は,マルチエージェントソフトアクター・クリニック(MA-SAC)強化学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - Adaptive Hierarchical SpatioTemporal Network for Traffic Forecasting [70.66710698485745]
本稿では,AHSTN(Adaptive Hierarchical SpatioTemporal Network)を提案する。
AHSTNは空間階層を利用し、マルチスケール空間相関をモデル化する。
2つの実世界のデータセットの実験により、AHSTNはいくつかの強いベースラインよりも優れたパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2023-06-15T14:50:27Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。