論文の概要: Robust and Efficient Communication in Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2511.11393v1
- Date: Fri, 14 Nov 2025 15:23:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.676923
- Title: Robust and Efficient Communication in Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習におけるロバストと効率的なコミュニケーション
- Authors: Zejiao Liu, Yi Li, Jiali Wang, Junqi Tu, Yitian Hong, Fangfei Li, Yang Liu, Toshiharu Sugawara, Yang Tang,
- Abstract要約: マルチエージェント強化学習(MARL)は,自律エージェント間の協調行動の実現に大きく貢献している。
既存のほとんどのアプローチは、通信は瞬時に、信頼性があり、帯域幅が無制限であると仮定している。
本調査は, 現実的な制約下でのMARLの堅牢かつ効率的な通信戦略の最近の進歩を体系的にレビューする。
- 参考スコア(独自算出の注目度): 18.405707681765453
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Multi-agent reinforcement learning (MARL) has made significant strides in enabling coordinated behaviors among autonomous agents. However, most existing approaches assume that communication is instantaneous, reliable, and has unlimited bandwidth; these conditions are rarely met in real-world deployments. This survey systematically reviews recent advances in robust and efficient communication strategies for MARL under realistic constraints, including message perturbations, transmission delays, and limited bandwidth. Furthermore, because the challenges of low-latency reliability, bandwidth-intensive data sharing, and communication-privacy trade-offs are central to practical MARL systems, we focus on three applications involving cooperative autonomous driving, distributed simultaneous localization and mapping, and federated learning. Finally, we identify key open challenges and future research directions, advocating a unified approach that co-designs communication, learning, and robustness to bridge the gap between theoretical MARL models and practical implementations.
- Abstract(参考訳): マルチエージェント強化学習(MARL)は,自律エージェント間の協調行動の実現に大きく貢献している。
しかし、既存のほとんどのアプローチでは、通信は瞬時に、信頼性があり、帯域幅が無制限であると仮定している。
本調査は, メッセージの摂動, 送信遅延, 帯域幅の制限など, 現実的な制約下でのMARLの堅牢かつ効率的な通信戦略の最近の進歩を体系的にレビューする。
さらに、低レイテンシ信頼性、帯域幅集約データ共有、通信プライバシトレードオフといった課題が実践的なMARLシステムの中心であるため、協調自動運転、分散同時ローカライゼーションとマッピング、フェデレーション学習を含む3つの応用に焦点を当てる。
最後に,理論的MARLモデルと実践的実装のギャップを埋めるため,コミュニケーション,学習,堅牢性を両立する統一的なアプローチを提唱する。
関連論文リスト
- Learning to Interact in World Latent for Team Coordination [53.51290193631586]
本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。
コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。
私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文 参考訳(メタデータ) (2025-09-29T22:13:39Z) - Multi-Agent Reinforcement Learning in Intelligent Transportation Systems: A Comprehensive Survey [1.8899300124593648]
本稿では、ITSにおけるMARL(Multi Agent Reinforcement Learning)の適用状況について調査する。
MARLは、分散エージェントが最適な戦略を共同で学習できるようにすることによって、これらの課題に対処するための有望なパラダイムを提供する。
我々はMARLアプローチを調整モデルと学習アルゴリズム、価値ベース、ポリシーベース、アクター評論家、コミュニケーション強化フレームワークに基づいて分類する構造化分類を導入する。
論文 参考訳(メタデータ) (2025-08-27T23:04:34Z) - Multi-Modal Self-Supervised Semantic Communication [52.76990720898666]
本稿では,マルチモーダルな自己教師型学習を活用し,タスク非依存の特徴抽出を強化するマルチモーダルセマンティックコミュニケーションシステムを提案する。
提案手法は,訓練関連通信オーバーヘッドを最小限に抑えつつ,モダリティの不変性とモダリティ特有の特徴の両方を効果的に捉えている。
この結果は、セマンティックコミュニケーションにおけるマルチモーダルな自己教師型学習の利点を浮き彫りにし、より効率的でスケーラブルなエッジ推論システムへの道を開いた。
論文 参考訳(メタデータ) (2025-03-18T06:13:02Z) - Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - Fully Independent Communication in Multi-Agent Reinforcement Learning [4.470370168359807]
MARL(Multi-Agent Reinforcement Learning)は、マルチエージェントシステム分野における幅広い研究領域である。
パラメータを共有しないMARLの独立学習者がいかにコミュニケーションできるかを検討する。
この結果から, 独立エージェントは, 課題にも拘わらず, コミュニケーション戦略を学習できることが示唆された。
論文 参考訳(メタデータ) (2024-01-26T18:42:01Z) - Collaborative Information Dissemination with Graph-based Multi-Agent
Reinforcement Learning [2.9904113489777826]
本稿では,効率的な情報伝達のためのマルチエージェント強化学習(MARL)手法を提案する。
本稿では,各エージェントが個別にメッセージ転送を決定するための情報発信のための部分観測可能なゲーム(POSG)を提案する。
実験の結果,既存の手法よりも訓練済みの方針が優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-25T21:30:16Z) - Multi-Agent Adversarial Attacks for Multi-Channel Communications [24.576538640840976]
無線通信シナリオにおける敵をモデル化・解析するためのマルチエージェント・敵システム(MAAS)を提案する。
相手を学習エージェントとしてモデル化することにより,提案するMAASが,送信者戦略の事前知識を必要とせず,送信チャネルと割り当てされた各パワーを適切に選択可能であることを示す。
論文 参考訳(メタデータ) (2022-01-22T23:57:00Z) - Scalable Multi-Agent Reinforcement Learning for Residential Load Scheduling under Data Governance [5.37556626581816]
マルチエージェント強化学習 (MARL) は, 協調型住宅負荷スケジューリング問題において, 顕著な進歩を遂げている。
MARLの最も一般的なパラダイムである集中型トレーニングは、通信制約のあるクラウドエッジ環境における大規模デプロイメントを制限する。
提案手法は,家庭の局所的な観察のみに基づく個人評論家の学習機能である,アクタ批判的手法に基づく。
論文 参考訳(メタデータ) (2021-10-06T14:05:26Z) - Communication-Efficient and Distributed Learning Over Wireless Networks:
Principles and Applications [55.65768284748698]
機械学習(ML)は、第5世代(5G)通信システムなどのための有望なイネーブルである。
本稿では、関連するコミュニケーションとMLの原則を概観し、選択したユースケースでコミュニケーション効率と分散学習フレームワークを提示することを目的とする。
論文 参考訳(メタデータ) (2020-08-06T12:37:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。