論文の概要: Equivariant Multi-agent Reinforcement Learning for Multimodal Vehicle-to-Infrastructure Systems
- arxiv url: http://arxiv.org/abs/2604.06914v1
- Date: Wed, 08 Apr 2026 10:13:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.47531
- Title: Equivariant Multi-agent Reinforcement Learning for Multimodal Vehicle-to-Infrastructure Systems
- Title(参考訳): マルチモーダル車-車間システムのための等価マルチエージェント強化学習
- Authors: Charbel Bou Chaaya, Mehdi Bennis,
- Abstract要約: 分散基地局(BS)が道路側ユニット(RSU)として機能するV2Iシステムについて検討する。
我々は、各RSUがそのリソースを最適化するためにローカルな観測に依存する分散レート問題を考える。
我々はこの問題を,車両位置の対称性を取り入れた分散マルチエージェント強化学習(MARL)問題として再考した。
- 参考スコア(独自算出の注目度): 27.423287406667885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study a vehicle-to-infrastructure (V2I) system where distributed base stations (BSs) acting as road-side units (RSUs) collect multimodal (wireless and visual) data from moving vehicles. We consider a decentralized rate maximization problem, where each RSU relies on its local observations to optimize its resources, while all RSUs must collaborate to guarantee favorable network performance. We recast this problem as a distributed multi-agent reinforcement learning (MARL) problem, by incorporating rotation symmetries in terms of vehicles' locations. To exploit these symmetries, we propose a novel self-supervised learning framework where each BS agent aligns the latent features of its multimodal observation to extract the positions of the vehicles in its local region. Equipped with this sensing data at each RSU, we train an equivariant policy network using a graph neural network (GNN) with message passing layers, such that each agent computes its policy locally, while all agents coordinate their policies via a signaling scheme that overcomes partial observability and guarantees the equivariance of the global policy. We present numerical results carried out in a simulation environment, where ray-tracing and computer graphics are used to collect wireless and visual data. Results show the generalizability of our self-supervised and multimodal sensing approach, achieving more than two-fold accuracy gains over baselines, and the efficiency of our equivariant MARL training, attaining more than 50% performance gains over standard approaches.
- Abstract(参考訳): 本稿では,道路側ユニット(RSU)として機能する分散基地局(BS)が移動車から多目的(無線・視覚)データを収集するV2Iシステムについて検討する。
我々は、各RSUがそのリソースを最適化するためにローカルな観測に依存している分散レート最大化の問題を考え、一方、すべてのRSUは、良好なネットワーク性能を保証するために協力する必要がある。
我々はこの問題を,車両の位置に回転対称性を組み込むことにより,分散マルチエージェント強化学習(MARL)問題として再考した。
これらの対称性を活用するために,各BSエージェントがマルチモーダル観測の潜在的特徴を整列させて,その局所領域における車両の位置を抽出する,新たな自己教師型学習フレームワークを提案する。
各RSUにこのセンシングデータを組み、各エージェントがローカルにポリシーを計算し、すべてのエージェントが部分的可観測性を克服し、グローバルポリシーの同値性を保証するシグナリングスキームを介してポリシーを調整するように、グラフニューラルネットワーク(GNN)を用いて同変ポリシーネットワークを訓練する。
本稿では,無線および視覚データ収集にレイトレーシングとコンピュータグラフィックスを用いるシミュレーション環境で行った数値結果について述べる。
その結果、ベースラインよりも2倍以上の精度向上を実現し、標準アプローチよりも50%以上の性能向上を実現したMARLトレーニングの効率性が示された。
関連論文リスト
- Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions [51.22818149833102]
マルチエージェント強化学習(MARL)は、車間通信(C-V2X)ネットワークにおける無線リソース割り当ての有望なアプローチとして登場した。
しかし、MARLに固有の多面的課題はしばしば絡み合っており、車載環境における個々の影響を理解することは困難である。
我々は, C-V2X RRA を, 複雑さが徐々に増大する多エージェント干渉ゲーム列として定式化し, このギャップを埋める。
論文 参考訳(メタデータ) (2026-02-18T14:46:56Z) - A Measurement Report Data-Driven Framework for Localized Statistical Channel Modeling [25.91473621688449]
局所統計チャネルモデリング(LSCM)は、ディジタルツインアシストネットワーク最適化における効果的な性能評価に不可欠である。
既存の手法は、高い収集コストと限られた空間範囲を持つ駆動テストデータに大きく依存している。
本稿では,低コストかつ広範囲なMRデータの収集を活かしたLSCMのための計測レポート(MR)データ駆動フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-16T10:59:22Z) - Generalization in Reinforcement Learning for Radio Access Networks [2.9822261313236513]
RAN制御のための一般化中心RLフレームワークを提案する。
部分的および雑音的な観測から動的に様々な状態を頑健に再構成する。
無線ノード、セル属性、およびそれらのトポロジなどの静的および半静的情報をグラフ表現によってエンコードする。
論文 参考訳(メタデータ) (2025-07-09T07:22:22Z) - Leveraging Optimal Transport for Distributed Two-Sample Testing: An Integrated Transportation Distance-based Framework [2.65043787671605]
本稿では,ITD(Integrated Transportation Distance)を用いた分散二サンプルテストのための新しいフレームワークを提案する。
データプライバシを保ちながら効率的な計算を可能にするために、分散環境での実装のための置換テスト手順が提案されている。
結果は、ITDが分散クライアント間で情報を効果的に集約し、個々のクライアントを調べる際に見逃される可能性のある微妙な分散シフトを検出することを示唆している。
論文 参考訳(メタデータ) (2025-06-19T05:59:48Z) - FedRAV: Hierarchically Federated Region-Learning for Traffic Object Classification of Autonomous Vehicles [7.8896851741869085]
自動運転車の階層的統合地域学習フレームワーク(FedRAV)を提案する。
FedRAVは、定義された地域距離に基づいて、車両を含む広い領域をサブリージョンに適応的に分割し、パーソナライズされた車両モデルと地域モデルを達成する。
実験の結果、我々のフレームワークはこれらの既知のアルゴリズムより優れており、少なくとも3.69%精度が向上していることがわかった。
論文 参考訳(メタデータ) (2024-11-21T09:45:55Z) - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning [98.26836657967162]
textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-23T18:56:26Z) - On Addressing Heterogeneity in Federated Learning for Autonomous
Vehicles Connected to a Drone Orchestrator [32.61132332561498]
我々は,自動運転車の性能を向上する上で,連邦学習(FL)のシナリオを想定する。
我々は,自律走行車の名目上の操作を損なう可能性のある,特定の種類の臨界物体(CO)の学習を加速する問題に焦点をあてる。
論文 参考訳(メタデータ) (2021-08-05T16:25:48Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z) - Global Distance-distributions Separation for Unsupervised Person
Re-identification [93.39253443415392]
既存の教師なしのReIDアプローチは、距離ベースのマッチング/ランク付けを通じて正のサンプルと負のサンプルを正しく識別するのに失敗することが多い。
本研究では,2つの分布に対する大域的距離分布分離の制約を導入し,大域的視点から正と負のサンプルを明確に分離することを奨励する。
本研究では,本手法がベースラインを大幅に改善し,最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2020-06-01T07:05:39Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。