論文の概要: URB - Urban Routing Benchmark for RL-equipped Connected Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2505.17734v2
- Date: Tue, 28 Oct 2025 09:06:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:35.897527
- Title: URB - Urban Routing Benchmark for RL-equipped Connected Autonomous Vehicles
- Title(参考訳): URBによるRL接続型自律走行車両の都市計画ベンチマーク
- Authors: Ahmet Onur Akman, Anastasia Psarou, Michał Hoffmann, Łukasz Gorczyca, Łukasz Kowalski, Paweł Gora, Grzegorz Jamróz, Rafał Kucharski,
- Abstract要約: RL搭載CAVのためのURB: Urban Routing Benchmarkを提案する。
URBは29の現実世界のネットワークで評価を統一する総合的なベンチマーク環境である。
その結果、長いトレーニングとコストのかかるトレーニングにもかかわらず、最先端のMARLアルゴリズムが人間を上回ることはめったにないことがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Connected Autonomous Vehicles (CAVs) promise to reduce congestion in future urban networks, potentially by optimizing their routing decisions. Unlike for human drivers, these decisions can be made with collective, data-driven policies, developed using machine learning algorithms. Reinforcement learning (RL) can facilitate the development of such collective routing strategies, yet standardized and realistic benchmarks are missing. To that end, we present URB: Urban Routing Benchmark for RL-equipped Connected Autonomous Vehicles. URB is a comprehensive benchmarking environment that unifies evaluation across 29 real-world traffic networks paired with realistic demand patterns. URB comes with a catalog of predefined tasks, multi-agent RL (MARL) algorithm implementations, three baseline methods, domain-specific performance metrics, and a modular configuration scheme. Our results show that, despite the lengthy and costly training, state-of-the-art MARL algorithms rarely outperformed humans. The experimental results reported in this paper initiate the first leaderboard for MARL in large-scale urban routing optimization. They reveal that current approaches struggle to scale, emphasizing the urgent need for advancements in this domain.
- Abstract(参考訳): コネクテッド・オートモービルズ(CAV)は、将来の都市ネットワークにおいて、ルーティング決定を最適化することで渋滞を減らすことを約束している。
人間のドライバとは異なり、これらの決定は、機械学習アルゴリズムを使用して開発された集合的でデータ駆動のポリシーで行うことができる。
強化学習(RL)は、このような集合的ルーティング戦略の開発を促進するが、標準化され、現実的なベンチマークが欠落している。
この目的のために、我々はRB:Urban Routing Benchmark for RL-equiped Connected autonomous Vehiclesを紹介する。
URBは、現実的な需要パターンと組み合わせた29の現実世界のトラフィックネットワークに対する評価を統一する総合的なベンチマーク環境である。
URBには、予め定義されたタスクのカタログ、マルチエージェントRL(MARL)アルゴリズムの実装、3つのベースラインメソッド、ドメイン固有のパフォーマンスメトリクス、モジュール構成スキームが含まれている。
我々の結果は、長大で高価な訓練にもかかわらず、最先端のMARLアルゴリズムが人間を上回ることは滅多にないことを示している。
本稿では,大規模都市経路最適化において,MARLのリーダボードを初めて導入する実験結果について報告する。
彼らは、現在のアプローチがスケールするのに苦労していることを明らかにし、この領域における急激な進歩の必要性を強調している。
関連論文リスト
- Realistic Urban Traffic Generator using Decentralized Federated Learning for the SUMO simulator [2.281163408378731]
DesRUTGeは、Deep Reinforcement LearningエージェントをSUMOシミュレータと統合し、現実的な24時間トラフィックパターンを生成する新しいフレームワークである。
DesRUTGeの重要な革新は、分散フェデレートラーニング(DFL)を使用することで、各トラフィック検出器とその対応する都市ゾーンが独立した学習ノードとして機能する。
論文 参考訳(メタデータ) (2025-06-09T17:51:45Z) - Accelerating Vehicle Routing via AI-Initialized Genetic Algorithms [55.78505925402658]
車両ルーティング問題(VRP)は、トラベリングセールスパーソン問題の延長であり、進化的最適化における基本的なNPハードチャレンジである。
遺伝的アルゴリズムによってさらに最適化された初期解を迅速に生成するために、強化学習エージェント(事前インスタンスで訓練された)を使用した新しい最適化フレームワークを導入する。
例えば、EARLIは1秒以内に500カ所の車両ルーティングを処理し、同じソリューション品質の現在のソルバよりも10倍高速で、リアルタイムやインタラクティブなルーティングのようなアプリケーションを可能にする。
論文 参考訳(メタデータ) (2025-04-08T15:21:01Z) - Autonomous Vehicles Using Multi-Agent Reinforcement Learning for Routing Decisions Can Harm Urban Traffic [0.0]
同時経路最適化のためのマルチエージェント強化学習(MARL)を用いた自律走行車(AV)は、交通環境を不安定にする可能性がある。
標準的なMARLアルゴリズムによる実験では、自明な場合であっても、ポリシーが最適解に収束しない場合が多いことが判明した。
今後の研究は、現実的なベンチマーク、慎重なデプロイメント戦略、AVルーティングの監視と規制のためのツールを優先する必要がある。
論文 参考訳(メタデータ) (2025-02-18T13:37:02Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - From Imitation to Exploration: End-to-end Autonomous Driving based on World Model [24.578178308010912]
RAMBLEは、意思決定を駆動するエンド・ツー・エンドの世界モデルベースのRL方式である。
複雑な動的トラフィックシナリオを処理できる。
CARLA Leaderboard 1.0では、ルート完了率の最先端のパフォーマンスを達成し、CARLA Leaderboard 2.0では38のシナリオをすべて完了している。
論文 参考訳(メタデータ) (2024-10-03T06:45:59Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - Reinforcement Learning for Datacenter Congestion Control [50.225885814524304]
渋滞制御アルゴリズムの成功は、レイテンシとネットワーク全体のスループットを劇的に改善する。
今日まで、このような学習ベースのアルゴリズムはこの領域で実用的な可能性を示さなかった。
実世界のデータセンターネットワークの様々な構成に一般化することを目的としたRLに基づくアルゴリズムを考案する。
本稿では,この手法が他のRL手法よりも優れており,トレーニング中に見られなかったシナリオに一般化可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T13:49:28Z) - Distributed Multi-agent Meta Learning for Trajectory Design in Wireless
Drone Networks [151.27147513363502]
本稿では,動的無線ネットワーク環境で動作するエネルギー制約型ドローン群に対する軌道設計の問題点について検討する。
値ベース強化学習(VDRL)ソリューションとメタトレイン機構を提案する。
論文 参考訳(メタデータ) (2020-12-06T01:30:12Z) - Pareto Deterministic Policy Gradients and Its Application in 5G Massive
MIMO Networks [32.099949375036495]
我々は,強化学習(RL)アプローチを用いて,セルロードバランスとネットワークスループットを協調的に最適化することを検討する。
RLの背景にある理論的根拠は、ユーザモビリティとネットワークのダイナミクスを解析的にモデル化することの難しさを回避することである。
この共同最適化を実現するために、ベクトル報酬をRL値ネットワークに統合し、別々のポリシーネットワークを介してRLアクションを実行する。
論文 参考訳(メタデータ) (2020-12-02T15:35:35Z) - Decentralized Deep Reinforcement Learning for Network Level Traffic
Signal Control [0.8838408191955874]
本稿では,交通信号制御における高速かつリアルタイムな性能を実現するために,完全分散型深層マルチエージェント強化学習(MARL)アルゴリズムのファミリーを提案する。
各交差点は、他の交差点ノードに対してマルコフゲームを行うエージェントとしてモデル化される。
実験結果から,S2R2Lはトレーニング過程において,IDQLやS2RLよりも高速に収束し,収束性能が向上していることがわかった。
論文 参考訳(メタデータ) (2020-07-02T06:58:27Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。