論文の概要: Multi-Agent Reinforcement Learning with Communication-Constrained Priors
- arxiv url: http://arxiv.org/abs/2512.03528v1
- Date: Wed, 03 Dec 2025 07:35:07 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:09:37.815174
- Title: Multi-Agent Reinforcement Learning with Communication-Constrained Priors
- Title(参考訳): コミュニケーション制約付き事前学習によるマルチエージェント強化学習
- Authors: Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang Gao,
- Abstract要約: コミュニケーションは、マルチエージェントシステムにおける協調政策の学習を改善する効果的な手段の1つである。
コミュニケーションを伴う既存のマルチエージェント強化学習は、複雑で動的な現実世界環境に適用するのに苦労する。
本稿では,コミュニケーションメッセージが世界的報酬に与える影響を定量化する,コミュニケーション制約付きマルチエージェント強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 22.124940712335434
- License:
- Abstract: Communication is one of the effective means to improve the learning of cooperative policy in multi-agent systems. However, in most real-world scenarios, lossy communication is a prevalent issue. Existing multi-agent reinforcement learning with communication, due to their limited scalability and robustness, struggles to apply to complex and dynamic real-world environments. To address these challenges, we propose a generalized communication-constrained model to uniformly characterize communication conditions across different scenarios. Based on this, we utilize it as a learning prior to distinguish between lossy and lossless messages for specific scenarios. Additionally, we decouple the impact of lossy and lossless messages on distributed decision-making, drawing on a dual mutual information estimatior, and introduce a communication-constrained multi-agent reinforcement learning framework, quantifying the impact of communication messages into the global reward. Finally, we validate the effectiveness of our approach across several communication-constrained benchmarks.
- Abstract(参考訳): コミュニケーションは、マルチエージェントシステムにおける協調政策の学習を改善する効果的な手段の1つである。
しかし、現実世界のほとんどのシナリオでは、損失の多いコミュニケーションが一般的な問題である。
通信による既存のマルチエージェント強化学習は、スケーラビリティと堅牢性に限界があるため、複雑で動的な現実世界環境に適用するのは難しい。
これらの課題に対処するため,様々なシナリオにまたがる通信条件を均一に特徴付ける汎用的な通信制約モデルを提案する。
これに基づいて、特定のシナリオに対する損失メッセージと損失メッセージの区別をする前に、学習として利用します。
さらに、分散意思決定におけるロスリーメッセージとロスレスメッセージの影響を分離し、相互情報推定器に描画し、コミュニケーションに制約のある多エージェント強化学習フレームワークを導入し、コミュニケーションメッセージが世界的報酬に与える影響を定量化する。
最後に,複数の通信制約のあるベンチマークを用いて,提案手法の有効性を検証する。
関連論文リスト
- Robust and Efficient Communication in Multi-Agent Reinforcement Learning [18.405707681765453]
マルチエージェント強化学習(MARL)は,自律エージェント間の協調行動の実現に大きく貢献している。
既存のほとんどのアプローチは、通信は瞬時に、信頼性があり、帯域幅が無制限であると仮定している。
本調査は, 現実的な制約下でのMARLの堅牢かつ効率的な通信戦略の最近の進歩を体系的にレビューする。
論文 参考訳(メタデータ) (2025-11-14T15:23:11Z) - In-Context Reinforcement Learning via Communicative World Models [49.00028802135605]
この研究は、2エージェントの緊急通信問題としてICRLを定式化する。
これは、転送可能な通信コンテキストを学ぶフレームワークであるCORALを紹介している。
実験により,本手法により,CAが試料効率を大幅に向上できることが実証された。
論文 参考訳(メタデータ) (2025-08-08T19:23:23Z) - Multi-Modal Self-Supervised Semantic Communication [52.76990720898666]
本稿では,マルチモーダルな自己教師型学習を活用し,タスク非依存の特徴抽出を強化するマルチモーダルセマンティックコミュニケーションシステムを提案する。
提案手法は,訓練関連通信オーバーヘッドを最小限に抑えつつ,モダリティの不変性とモダリティ特有の特徴の両方を効果的に捉えている。
この結果は、セマンティックコミュニケーションにおけるマルチモーダルな自己教師型学習の利点を浮き彫りにし、より効率的でスケーラブルなエッジ推論システムへの道を開いた。
論文 参考訳(メタデータ) (2025-03-18T06:13:02Z) - Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning Multi-Agent Communication with Contrastive Learning [3.816854668079928]
本稿では,コミュニケーション的メッセージが環境状態の異なる不完全なビューと見なされる,別の視点を紹介する。
送信したメッセージと受信したメッセージの関係を調べることで,コントラスト学習を用いてコミュニケーションを学ぶことを提案する。
通信環境において,本手法は性能と学習速度の両面で,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-03T23:51:05Z) - Cognitive Semantic Communication Systems Driven by Knowledge Graph:
Principle, Implementation, and Performance Evaluation [74.38561925376996]
単一ユーザと複数ユーザのコミュニケーションシナリオに対して,認知意味コミュニケーションフレームワークが2つ提案されている。
知識グラフから推論規則をマイニングすることにより,効果的な意味補正アルゴリズムを提案する。
マルチユーザ認知型セマンティックコミュニケーションシステムにおいて,異なるユーザのメッセージを識別するために,メッセージ復元アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-15T12:01:43Z) - On the Role of Emergent Communication for Social Learning in Multi-Agent
Reinforcement Learning [0.0]
社会学習は、専門家からのヒントを使って、異質なポリシーを整列し、サンプルの複雑さを減らし、部分的に観察可能なタスクを解決する。
本稿では,情報ボトルネックに基づく教師なし手法を提案する。
論文 参考訳(メタデータ) (2023-02-28T03:23:27Z) - Towards True Lossless Sparse Communication in Multi-Agent Systems [1.911678487931003]
コミュニケーションは、エージェントが目標を達成するために協力することを可能にする。
スパース個別化コミュニケーションの学習における最近の研究は、訓練中に高いばらつきに悩まされている。
情報ボトルネックを表現学習問題として、空間性を再設定するために使用します。
論文 参考訳(メタデータ) (2022-11-30T20:43:34Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - The Enforcers: Consistent Sparse-Discrete Methods for Constraining
Informative Emergent Communication [5.432350993419402]
コミュニケーションは、エージェントが目標を達成するために協力することを可能にする。
疎間コミュニケーションの学習における最近の研究は、特に協調作業において、コミュニケーションの減少のコストが報酬の減少につながるような、高分散トレーニングに悩まされている。
本研究は、コミュニケーションの減少による報酬の損失を抑え、差別に対するペナルティを排除し、上記の課題に対処する。
論文 参考訳(メタデータ) (2022-01-19T07:31:06Z) - Learning Structured Communication for Multi-agent Reinforcement Learning [104.64584573546524]
本研究では,マルチエージェント強化学習(MARL)環境下での大規模マルチエージェント通信機構について検討する。
本稿では、より柔軟で効率的な通信トポロジを用いて、LSC(Learning Structured Communication)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-11T07:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。