論文の概要: Robust and Efficient Communication in Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2511.11393v1
- Date: Fri, 14 Nov 2025 15:23:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.676923
- Title: Robust and Efficient Communication in Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習におけるロバストと効率的なコミュニケーション
- Authors: Zejiao Liu, Yi Li, Jiali Wang, Junqi Tu, Yitian Hong, Fangfei Li, Yang Liu, Toshiharu Sugawara, Yang Tang,
- Abstract要約: マルチエージェント強化学習(MARL)は,自律エージェント間の協調行動の実現に大きく貢献している。
既存のほとんどのアプローチは、通信は瞬時に、信頼性があり、帯域幅が無制限であると仮定している。
本調査は, 現実的な制約下でのMARLの堅牢かつ効率的な通信戦略の最近の進歩を体系的にレビューする。
- 参考スコア(独自算出の注目度): 18.405707681765453
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Multi-agent reinforcement learning (MARL) has made significant strides in enabling coordinated behaviors among autonomous agents. However, most existing approaches assume that communication is instantaneous, reliable, and has unlimited bandwidth; these conditions are rarely met in real-world deployments. This survey systematically reviews recent advances in robust and efficient communication strategies for MARL under realistic constraints, including message perturbations, transmission delays, and limited bandwidth. Furthermore, because the challenges of low-latency reliability, bandwidth-intensive data sharing, and communication-privacy trade-offs are central to practical MARL systems, we focus on three applications involving cooperative autonomous driving, distributed simultaneous localization and mapping, and federated learning. Finally, we identify key open challenges and future research directions, advocating a unified approach that co-designs communication, learning, and robustness to bridge the gap between theoretical MARL models and practical implementations.
- Abstract(参考訳): マルチエージェント強化学習(MARL)は,自律エージェント間の協調行動の実現に大きく貢献している。
しかし、既存のほとんどのアプローチでは、通信は瞬時に、信頼性があり、帯域幅が無制限であると仮定している。
本調査は, メッセージの摂動, 送信遅延, 帯域幅の制限など, 現実的な制約下でのMARLの堅牢かつ効率的な通信戦略の最近の進歩を体系的にレビューする。
さらに、低レイテンシ信頼性、帯域幅集約データ共有、通信プライバシトレードオフといった課題が実践的なMARLシステムの中心であるため、協調自動運転、分散同時ローカライゼーションとマッピング、フェデレーション学習を含む3つの応用に焦点を当てる。
最後に,理論的MARLモデルと実践的実装のギャップを埋めるため,コミュニケーション,学習,堅牢性を両立する統一的なアプローチを提唱する。
関連論文リスト
- IMAGINE: Intelligent Multi-Agent Godot-based Indoor Networked Exploration [0.0]
本稿では,2次元屋内環境における課題に対処するために,MARL(Multi-Agent Reinforcement Learning)を実装した。
政策訓練は、不確実性の下で創発的な協調行動と意思決定を達成することを目的としている。
論文 参考訳(メタデータ) (2026-02-02T22:08:41Z) - Bandwidth-Efficient Multi-Agent Communication through Information Bottleneck and Vector Quantization [2.5782420501870296]
本稿では,情報ボトルネック理論とベクトル量子化を組み合わせることで,マルチエージェント環境における選択的,帯域幅効率の高い通信を実現するフレームワークを提案する。
提案手法は,情報理論の原理的最適化により,タスククリティカルな情報を保存しながら,通信メッセージを圧縮・復号化することを学ぶ。
論文 参考訳(メタデータ) (2026-02-02T12:32:28Z) - Communication-Efficient Multi-Modal Edge Inference via Uncertainty-Aware Distributed Learning [60.650628083185616]
トレーニングと推論効率を向上させるために,3段階のコミュニケーション対応分散学習フレームワークを提案する。
StageIでは、デバイスがローカルなマルチモーダルな自己教師型学習を行い、デバイス-サーバ交換なしで共有およびモダリティ固有のエンコーダを得る。
集中的な顕在的融合校正による分散微調整は、モダリティごとの不確かさを解消し、ノイズやチャネルのフェーディングによって歪んだ特徴を確実に集約する。
不確実性誘導フィードバック機構であるStageIIIは、分散環境での通信精度のトレードオフを最適化し、不確実なサンプルに対する追加機能を選択的に要求する。
論文 参考訳(メタデータ) (2026-01-21T12:38:02Z) - Communication Methods in Multi-Agent Reinforcement Learning [0.0]
本稿では,マルチエージェント強化学習におけるコミュニケーション技術の概要について述べる。
このトピックに関する29の出版物の詳細な分析により、明示的、暗黙的、注目的、グラフ的、階層的/ロール的コミュニケーションの長所と短所が評価される。
論文 参考訳(メタデータ) (2026-01-19T09:39:00Z) - Multi-Agent Reinforcement Learning with Communication-Constrained Priors [22.124940712335434]
コミュニケーションは、マルチエージェントシステムにおける協調政策の学習を改善する効果的な手段の1つである。
コミュニケーションを伴う既存のマルチエージェント強化学習は、複雑で動的な現実世界環境に適用するのに苦労する。
本稿では,コミュニケーションメッセージが世界的報酬に与える影響を定量化する,コミュニケーション制約付きマルチエージェント強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-03T07:35:07Z) - Learning to Interact in World Latent for Team Coordination [53.51290193631586]
本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。
コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。
私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文 参考訳(メタデータ) (2025-09-29T22:13:39Z) - Multi-Agent Reinforcement Learning in Intelligent Transportation Systems: A Comprehensive Survey [1.8899300124593648]
本稿では、ITSにおけるMARL(Multi Agent Reinforcement Learning)の適用状況について調査する。
MARLは、分散エージェントが最適な戦略を共同で学習できるようにすることによって、これらの課題に対処するための有望なパラダイムを提供する。
我々はMARLアプローチを調整モデルと学習アルゴリズム、価値ベース、ポリシーベース、アクター評論家、コミュニケーション強化フレームワークに基づいて分類する構造化分類を導入する。
論文 参考訳(メタデータ) (2025-08-27T23:04:34Z) - Multi-Modal Self-Supervised Semantic Communication [52.76990720898666]
本稿では,マルチモーダルな自己教師型学習を活用し,タスク非依存の特徴抽出を強化するマルチモーダルセマンティックコミュニケーションシステムを提案する。
提案手法は,訓練関連通信オーバーヘッドを最小限に抑えつつ,モダリティの不変性とモダリティ特有の特徴の両方を効果的に捉えている。
この結果は、セマンティックコミュニケーションにおけるマルチモーダルな自己教師型学習の利点を浮き彫りにし、より効率的でスケーラブルなエッジ推論システムへの道を開いた。
論文 参考訳(メタデータ) (2025-03-18T06:13:02Z) - Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - Fully Independent Communication in Multi-Agent Reinforcement Learning [4.470370168359807]
MARL(Multi-Agent Reinforcement Learning)は、マルチエージェントシステム分野における幅広い研究領域である。
パラメータを共有しないMARLの独立学習者がいかにコミュニケーションできるかを検討する。
この結果から, 独立エージェントは, 課題にも拘わらず, コミュニケーション戦略を学習できることが示唆された。
論文 参考訳(メタデータ) (2024-01-26T18:42:01Z) - Collaborative Information Dissemination with Graph-based Multi-Agent
Reinforcement Learning [2.9904113489777826]
本稿では,効率的な情報伝達のためのマルチエージェント強化学習(MARL)手法を提案する。
本稿では,各エージェントが個別にメッセージ転送を決定するための情報発信のための部分観測可能なゲーム(POSG)を提案する。
実験の結果,既存の手法よりも訓練済みの方針が優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-25T21:30:16Z) - Multi-Agent Adversarial Attacks for Multi-Channel Communications [24.576538640840976]
無線通信シナリオにおける敵をモデル化・解析するためのマルチエージェント・敵システム(MAAS)を提案する。
相手を学習エージェントとしてモデル化することにより,提案するMAASが,送信者戦略の事前知識を必要とせず,送信チャネルと割り当てされた各パワーを適切に選択可能であることを示す。
論文 参考訳(メタデータ) (2022-01-22T23:57:00Z) - Federated Learning over Wireless IoT Networks with Optimized
Communication and Resources [98.18365881575805]
協調学習技術のパラダイムとしてのフェデレートラーニング(FL)は研究の注目を集めている。
無線システム上での高速応答および高精度FLスキームの検証が重要である。
提案する通信効率のよいフェデレーション学習フレームワークは,強い線形速度で収束することを示す。
論文 参考訳(メタデータ) (2021-10-22T13:25:57Z) - Scalable Multi-Agent Reinforcement Learning for Residential Load Scheduling under Data Governance [5.37556626581816]
マルチエージェント強化学習 (MARL) は, 協調型住宅負荷スケジューリング問題において, 顕著な進歩を遂げている。
MARLの最も一般的なパラダイムである集中型トレーニングは、通信制約のあるクラウドエッジ環境における大規模デプロイメントを制限する。
提案手法は,家庭の局所的な観察のみに基づく個人評論家の学習機能である,アクタ批判的手法に基づく。
論文 参考訳(メタデータ) (2021-10-06T14:05:26Z) - Communication-Efficient and Distributed Learning Over Wireless Networks:
Principles and Applications [55.65768284748698]
機械学習(ML)は、第5世代(5G)通信システムなどのための有望なイネーブルである。
本稿では、関連するコミュニケーションとMLの原則を概観し、選択したユースケースでコミュニケーション効率と分散学習フレームワークを提示することを目的とする。
論文 参考訳(メタデータ) (2020-08-06T12:37:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。