論文の概要: Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions
- arxiv url: http://arxiv.org/abs/2603.06607v1
- Date: Wed, 18 Feb 2026 14:46:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-15 16:38:22.426365
- Title: Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions
- Title(参考訳): V2Xリソース割り当てのためのマルチエージェントDRL:拡張チャレンジとベンチマークソリューション
- Authors: Siyuan Wang, Lei Lei, Pranav Maheshwari, Sam Bellefeuille, Kan Zheng, Dusit Niyato,
- Abstract要約: マルチエージェント強化学習(MARL)は、車間通信(C-V2X)ネットワークにおける無線リソース割り当ての有望なアプローチとして登場した。
しかし、MARLに固有の多面的課題はしばしば絡み合っており、車載環境における個々の影響を理解することは困難である。
我々は, C-V2X RRA を, 複雑さが徐々に増大する多エージェント干渉ゲーム列として定式化し, このギャップを埋める。
- 参考スコア(独自算出の注目度): 51.22818149833102
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent deep reinforcement learning (DRL) has emerged as a promising approach for radio resource allocation (RRA) in cellular vehicle-to-everything (C-V2X) networks. However, the multifaceted challenges inherent to multi-agent reinforcement learning (MARL) - including non-stationarity, coordination difficulty, large action spaces, partial observability, and limited robustness and generalization - are often intertwined, making it difficult to understand their individual impact on performance in vehicular environments. Moreover, existing studies typically rely on different baseline MARL algorithms, and a systematic comparison of their capabilities in addressing specific challenges in C-V2X RRA remains lacking. In this paper, we bridge this gap by formulating C-V2X RRA as a sequence of multi-agent interference games with progressively increasing complexity, each designed to isolate a key MARL challenge. Based on these formulations, we construct a suite of learning tasks that enable controlled evaluation of performance degradation attributable to each challenge. We further develop large-scale, diverse training and testing datasets using SUMO-generated highway traces to capture a wide range of vehicular topologies and corresponding interference patterns. Through extensive benchmarking of representative MARL algorithms, we identify policy robustness and generalization across diverse vehicular topologies as the dominant challenge in C-V2X RRA. We further show that, on the most challenging task, the best-performing actor-critic method outperforms the value-based approach by 42%. By emphasizing the need for zero-shot policy transfer to both seen and unseen topologies at runtime, and by open-sourcing the code, datasets, and interference-game benchmark suite, this work provides a systematic and reproducible foundation for evaluating and advancing MARL algorithms in vehicular networks.
- Abstract(参考訳): マルチエージェント深部強化学習(DRL)は,セルラー車間通信(C-V2X)ネットワークにおける無線リソース割り当て(RRA)の有望なアプローチとして登場した。
しかし、マルチエージェント強化学習(MARL)に固有の課題は、非定常性、調整困難、大きなアクション空間、部分的観測可能性、ロバスト性や一般化などである。
さらに、既存の研究は一般に異なるベースラインMARLアルゴリズムに依存しており、C-V2X RRAの特定の課題に対処する能力の体系的な比較は依然として不十分である。
本稿では,C-V2X RRAを,複雑化する多エージェント干渉ゲーム列として定式化することにより,このギャップを埋める。
これらの定式化に基づいて,各課題に起因する性能劣化の評価を制御可能な学習タスク群を構築した。
さらに、SUMO生成ハイウェイトレースを用いた大規模かつ多様なトレーニングおよびテストデータセットを開発し、広範囲の車両トポロジとそれに対応する干渉パターンをキャプチャする。
代表的MARLアルゴリズムの広範なベンチマークを通じて,C-V2X RRAにおける主要な課題として,多種多様な車両トポロジにまたがるポリシーの堅牢性と一般化を同定する。
さらに、最も困難なタスクでは、最高のパフォーマンスのアクター批判的手法が価値ベースのアプローチを42%上回ることを示す。
実行時に見られるトポロジと見えないトポロジの両方へのゼロショットポリシー転送の必要性を強調し、コード、データセット、干渉ゲームベンチマークスイートをオープンソース化することによって、本研究は、車載ネットワークにおけるMARLアルゴリズムの評価と進歩のための、体系的で再現可能な基盤を提供する。
関連論文リスト
- Constraints Matrix Diffusion based Generative Neural Solver for Vehicle Routing Problems [16.541111954252397]
本稿では、離散ノイズグラフ拡散モデルを用いて車両ルーティング問題の根底にある制約を学習する新しい融合ニューラルネットワークフレームワークを提案する。
この研究は、378の組合せ空間にわたるニューラルネットワークモデルの解法に関する、初めての総合的な実験的研究である。
論文 参考訳(メタデータ) (2026-03-08T10:03:34Z) - An Agentic Framework with LLMs for Solving Complex Vehicle Routing Problems [66.60904891478687]
複雑な車両ルーティング問題を解決するために,LLM (AFL) を用いたエージェントフレームワークを提案する。
AFLは生の入力から知識を直接抽出し、自己完結型コード生成を可能にする。
AFLは、コード信頼性とソリューション実現性の両方において、既存のLCMベースのベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2025-10-19T03:59:25Z) - Continual Learning for VLMs: A Survey and Taxonomy Beyond Forgetting [70.83781268763215]
視覚言語モデル(VLM)は、大規模事前学習を活用することで、多様なマルチモーダルタスクにおいて優れたパフォーマンスを実現している。
VLMは、クロスモーダル機能ドリフト、共有アーキテクチャによるパラメータ干渉、ゼロショット機能侵食など、ユニークな課題に直面している。
本調査は、生涯の視覚言語システムを開発する研究者にとって、包括的かつ診断的な基準となることを目的としている。
論文 参考訳(メタデータ) (2025-08-06T09:03:10Z) - RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization [111.1749164063616]
大規模言語モデル(LLM)のための新しいハイブリッド政治最適化手法RL-PLUSを提案する。
RL-PLUSは、外部データと内部エクスプロイトを相乗化して、より強力な推論能力を達成し、ベースモデルのバウンダリを超える。
提案手法の優位性と一般化性を示すため,理論解析と広範な実験を行った。
論文 参考訳(メタデータ) (2025-07-31T23:55:29Z) - Offline Multi-agent Reinforcement Learning via Score Decomposition [51.23590397383217]
オフライン協調型マルチエージェント強化学習(MARL)は、分散シフトによる固有の課題に直面している。
この作業は、オフラインとオンラインのMARL間の分散ギャップを明示的に解決する最初の作業である。
論文 参考訳(メタデータ) (2025-05-09T11:42:31Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - IntersectionZoo: Eco-driving for Benchmarking Multi-Agent Contextual Reinforcement Learning [4.80862277413422]
マルチエージェント強化学習のための総合ベンチマークスイートIntersectionZooを提案する。
IntersectionZooを実世界のアプリケーションに接地することで、実世界の問題の特徴を自然に捉えることができる。
IntersectionZooは、米国の主要10都市の16,334の信号化交差点のデータインフォームドシミュレーションに基づいて構築されている。
論文 参考訳(メタデータ) (2024-10-19T21:34:24Z) - Multi-Task Learning for Routing Problem with Cross-Problem Zero-Shot Generalization [18.298695520665348]
車両ルーティング問題(VRP)は多くの現実世界のアプリケーションで見られる。
本研究では,クロスプロブレム一般化という重要な課題に取り組むための最初の試みを行う。
提案モデルでは、ゼロショットの一般化方式で、見当たらない属性の組み合わせでVRPを解くことができる。
論文 参考訳(メタデータ) (2024-02-23T13:25:23Z) - Multi-Agent Reinforcement Learning for Adaptive Mesh Refinement [17.72127385405445]
完全協調型マルコフゲームとしてアダプティブメッシュリファインメント(AMR)の新たな定式化を提案する。
VDGN(Value Decomposition Graph Network)と呼ばれる新しい深層マルチエージェント強化学習アルゴリズムを設計する。
VDGNポリシは,グローバルエラーおよびコスト指標において,エラーしきい値に基づくポリシよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2022-11-02T00:41:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。