論文の概要: Multi-Agent Reinforcement Learning in Intelligent Transportation Systems: A Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2508.20315v1
- Date: Wed, 27 Aug 2025 23:04:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:01.861346
- Title: Multi-Agent Reinforcement Learning in Intelligent Transportation Systems: A Comprehensive Survey
- Title(参考訳): インテリジェントトランスポートシステムにおけるマルチエージェント強化学習:総合的調査
- Authors: RexCharles Donatus, Kumater Ter, Ore-Ofe Ajayi, Daniel Udekwe,
- Abstract要約: 本稿では、ITSにおけるMARL(Multi Agent Reinforcement Learning)の適用状況について調査する。
MARLは、分散エージェントが最適な戦略を共同で学習できるようにすることによって、これらの課題に対処するための有望なパラダイムを提供する。
我々はMARLアプローチを調整モデルと学習アルゴリズム、価値ベース、ポリシーベース、アクター評論家、コミュニケーション強化フレームワークに基づいて分類する構造化分類を導入する。
- 参考スコア(独自算出の注目度): 1.8899300124593648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing complexity of urban mobility and the demand for efficient, sustainable, and adaptive solutions have positioned Intelligent Transportation Systems (ITS) at the forefront of modern infrastructure innovation. At the core of ITS lies the challenge of autonomous decision-making across dynamic, large scale, and uncertain environments where multiple agents traffic signals, autonomous vehicles, or fleet units must coordinate effectively. Multi Agent Reinforcement Learning (MARL) offers a promising paradigm for addressing these challenges by enabling distributed agents to jointly learn optimal strategies that balance individual objectives with system wide efficiency. This paper presents a comprehensive survey of MARL applications in ITS. We introduce a structured taxonomy that categorizes MARL approaches according to coordination models and learning algorithms, spanning value based, policy based, actor critic, and communication enhanced frameworks. Applications are reviewed across key ITS domains, including traffic signal control, connected and autonomous vehicle coordination, logistics optimization, and mobility on demand systems. Furthermore, we highlight widely used simulation platforms such as SUMO, CARLA, and CityFlow that support MARL experimentation, along with emerging benchmarks. The survey also identifies core challenges, including scalability, non stationarity, credit assignment, communication constraints, and the sim to real transfer gap, which continue to hinder real world deployment.
- Abstract(参考訳): 都市移動の複雑さの増大と、効率的で持続可能で適応的なソリューションの需要は、知能交通システム(ITS)を近代的なインフラ革新の最前線に位置づけている。
ITSの核心は、ダイナミックで大規模で不確実な環境における自律的な意思決定の課題であり、複数のエージェントが交通信号、自動運転車、または艦隊ユニットを効果的に調整する必要がある。
MARL(Multi Agent Reinforcement Learning)は、分散エージェントが個々の目的とシステム全体の効率性のバランスをとる最適な戦略を共同で学習できるようにすることによって、これらの課題に対処するための有望なパラダイムを提供する。
本稿では,ITSにおけるMARL応用に関する包括的調査を行う。
我々はMARLアプローチを調整モデルと学習アルゴリズム、価値ベース、ポリシーベース、アクター評論家、コミュニケーション強化フレームワークに基づいて分類する構造的分類を導入する。
アプリケーションは、交通信号制御、コネクテッドおよび自律走行車両調整、ロジスティクス最適化、需要システムにおけるモビリティなど、主要なITS領域にまたがってレビューされる。
さらに、SUMO、CARLA、CityFlowといった、MARL実験をサポートする広く使われているシミュレーションプラットフォームと、新たなベンチマークを強調した。
この調査では、スケーラビリティ、非定常性、クレジットの割り当て、通信の制約、実際の転送ギャップのシミュレーションといった、現実世界のデプロイメントを妨げ続けている重要な課題も挙げている。
関連論文リスト
- Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.198001060683296]
大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。
LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。
それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文 参考訳(メタデータ) (2025-03-27T11:56:27Z) - Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。
人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:49:25Z) - CoDriveVLM: VLM-Enhanced Urban Cooperative Dispatching and Motion Planning for Future Autonomous Mobility on Demand Systems [17.765742276150565]
CoDriveVLMは、将来の自律型モビリティ・オン・デマンド(AMoD)システムのために、高忠実な同時ディスパッチと協調動作計画を統合する新しいフレームワークである。
提案手法は,視覚言語モデル(VLM)を用いて多モード情報処理を強化し,包括的ディスパッチと衝突リスク評価を可能にする。
論文 参考訳(メタデータ) (2025-01-10T17:44:57Z) - GenAI-powered Multi-Agent Paradigm for Smart Urban Mobility: Opportunities and Challenges for Integrating Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG) with Intelligent Transportation Systems [10.310791311301962]
本稿では,大規模言語モデル (LLM) と新生検索・拡張生成技術 (RAG) の変換可能性について検討する。
本稿では,スマートモビリティサービスをインテリジェントかつ対話的に提供可能なマルチエージェントシステムの開発を目的とした概念的フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-31T16:14:42Z) - Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents [101.17919953243107]
GovSimは、大規模言語モデル(LLM)における戦略的相互作用と協調的意思決定を研究するために設計された生成シミュレーションプラットフォームである。
最強のLSMエージェントを除く全てのエージェントは、GovSimの持続的均衡を達成することができず、生存率は54%以下である。
道徳的思考の理論である「大学化」に基づく推論を活用するエージェントは、持続可能性を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-04-25T15:59:16Z) - LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.7788636451616697]
本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。
LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。
シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文 参考訳(メタデータ) (2024-03-13T08:41:55Z) - Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。
モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。
本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文 参考訳(メタデータ) (2023-06-29T15:57:07Z) - Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement
Learning Approach [11.168121941015013]
バスの束縛は、バスシステムの効率性と信頼性を損なう一般的な現象である。
我々は,連続制御学習のための分散MARLフレームワーク,IQNC-Mを開発した。
提案するIQNC-Mフレームワークは,様々な極端な事象を効果的に処理できることを示す。
論文 参考訳(メタデータ) (2021-11-02T23:41:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。