論文の概要: Decoupling Communication from Policy: Robust MARL under Bandwidth Constraints
- arxiv url: http://arxiv.org/abs/2605.21085v1
- Date: Wed, 20 May 2026 12:21:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.660626
- Title: Decoupling Communication from Policy: Robust MARL under Bandwidth Constraints
- Title(参考訳): 政策からのコミュニケーションの疎結合:帯域制限下でのロバストMARL
- Authors: Alexi Canesse, Benoît Goupil, Jesse Read, Sonia Vanier,
- Abstract要約: ドローン群による検索と救助のような現実世界のアプリケーションの多くは、厳しい帯域制限の下で動作している。
私たちは、分散度、ラウンド、メッセージ次元を1つの同等の制約に統一する正規化された1エージェント単位の帯域幅予算である$を紹介します。
第2に,政策の潜在表現から通信経路を分離する最小限のアーキテクチャであるSLIMを提供する。
提案手法は, 帯域幅が小さくなるにつれて限界劣化しかなく, 限られた通信環境下での堅牢性を示す。
- 参考スコア(独自算出の注目度): 1.909020214605419
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Communication enables coordination in multi-agent reinforcement learning (MARL), but many real-world applications, e.g., search-and-rescue with drone swarms, operate under severe bandwidth constraints. Many communication architectures still expose a coupled bottleneck in which a shared latent representation is used for both policy execution and inter-agent communication. Consequently, reducing message size directly limits the policy's latent space, often leading to significant performance degradation. We address this with two contributions. First, we introduce $β$, a normalised per-agent bandwidth budget that unifies sparsity, rounds, and message dimension into a single comparable constraint. Second, we provide SLIM, a minimal architecture that decouples the communication pathway from the policy's latent representation, allowing us to isolate the effect of bandwidth from the effect of policy capacity while benefiting from in-step communication. We evaluate our method on several partially-observable MARL benchmarks, where communication is essential. Our approach achieves state-of-the-art performance and exhibits scalability and robustness under limited communication, with only marginal degradation as bandwidth is reduced.
- Abstract(参考訳): 通信はマルチエージェント強化学習(MARL)における協調を可能にするが、例えば、ドローン群による検索と救助といった現実世界のアプリケーションの多くは、厳しい帯域幅の制約の下で動作している。
多くの通信アーキテクチャは、ポリシー実行とエージェント間通信の両方に共有潜在表現が使用される、結合されたボトルネックをまだ明らかにしている。
その結果、メッセージサイズを減らすことでポリシーの遅延スペースが直接制限され、しばしばパフォーマンスが大幅に低下する。
これを2つのコントリビューションで解決する。
まず、分散度、ラウンド、メッセージ次元を1つの同等の制約に統一する、正規化されたアジェント単位の帯域幅予算である$β$を紹介します。
第2に、SLIMは、ポリシーの潜在表現から通信経路を分離する最小限のアーキテクチャであり、ステップ内通信の恩恵を受けながら、ポリシーキャパシティの効果から帯域幅の影響を分離することができる。
通信が不可欠である部分観測可能なMARLベンチマークを用いて,本手法の評価を行った。
提案手法は,帯域幅が小さくなるにつれて限界劣化しかなく,限られた通信環境下でのスケーラビリティとロバスト性を示す。
関連論文リスト
- Reason-to-Transmit: Deliberative Adaptive Communication for Cooperative Perception [0.0]
Reason-to-Transmit (R2T) は、各エージェントに軽量トランスフォーマーベースのモジュールを装備するフレームワークである。
R2Tは、鳥眼視環境において、9つの基準線に対して評価される。
論文 参考訳(メタデータ) (2026-03-19T15:54:26Z) - Bandwidth-Efficient Multi-Agent Communication through Information Bottleneck and Vector Quantization [2.5782420501870296]
本稿では,情報ボトルネック理論とベクトル量子化を組み合わせることで,マルチエージェント環境における選択的,帯域幅効率の高い通信を実現するフレームワークを提案する。
提案手法は,情報理論の原理的最適化により,タスククリティカルな情報を保存しながら,通信メッセージを圧縮・復号化することを学ぶ。
論文 参考訳(メタデータ) (2026-02-02T12:32:28Z) - CoCo-Fed: A Unified Framework for Memory- and Communication-Efficient Federated Learning at the Wireless Edge [50.42067935605982]
ローカルメモリの効率とグローバル通信の削減を両立させる新しい圧縮・結合型学習フレームワークを提案する。
CoCo-Fedは、メモリと通信効率の両方において最先端のベースラインを著しく上回り、非IID設定下では堅牢な収束を維持している。
論文 参考訳(メタデータ) (2026-01-02T03:39:50Z) - Large Speech Model Enabled Semantic Communication [58.027223937172955]
大規模音声モデルにより意味コミュニケーション(LargeSC)が可能となった。
我々は、大きなモデルに埋め込まれた豊富な意味的知識を活用し、損失のあるチャネル上で適応的な伝達を可能にする。
システムは、550bpsから2.06kbpsまでの帯域幅をサポートし、パケット損失率の高い音声品質において、従来のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-12-04T11:58:08Z) - Task-Oriented Multimodal Token Transmission in Resource-Constrained Multiuser Networks [19.42660454288912]
本稿では,効率的なマルチモーダル情報融合と利用のためのタスク指向マルチモーダルトークン伝送方式を提案する。
トークン伝送の効率を向上させるため,クロスモーダルアライメントやタスク指向微調整を含む2段階トレーニングアルゴリズムを設計した。
我々は、交互最適化手法を用いて、ユーザ間での帯域幅、電力割り当て、トークン長を共同で最適化する。
論文 参考訳(メタデータ) (2025-05-06T14:17:05Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Communication-Efficient Split Learning Based on Analog Communication and
Over the Air Aggregation [48.150466900765316]
スプリットラーニング(SL)は、その固有のプライバシー保護機能と、限られた計算能力を持つデバイスに対する協調推論を可能にする能力により、最近人気を集めている。
標準SLアルゴリズムは、理想的なデジタル通信システムを想定し、通信帯域不足の問題を無視している。
本稿では,エージェント側で追加層を導入し,重みとバイアスの選択を制約し,空気の凝集を確実にするための新しいSLフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-02T07:49:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。