論文の概要: Bandwidth-constrained Variational Message Encoding for Cooperative Multi-agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2512.11179v1
- Date: Thu, 11 Dec 2025 23:56:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.601067
- Title: Bandwidth-constrained Variational Message Encoding for Cooperative Multi-agent Reinforcement Learning
- Title(参考訳): 協調型マルチエージェント強化学習のための帯域制限付き変分メッセージ符号化
- Authors: Wei Duan, Jie Lu, En Yu, Junyu Xuan,
- Abstract要約: グラフベースのマルチエージェント強化学習(MARL)は,ノードとしてエージェントをモデル化し,エッジとして通信リンクをモデル化することにより,部分観測可能性下での協調動作を可能にする。
本研究では,この帯域幅制限方式について検討し,ナイーブ次元の低減が常に調整性能を低下させることを示す。
我々は,KLの発散により正規化されたガウスのサンプルとしてメッセージを扱う軽量モジュールであるBVME(Band-Constrained Variational Message)を紹介する。
BVMEは67~83%のメッセージディメンションを使用しながら、同等あるいは優れたパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 23.866517021196724
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph-based multi-agent reinforcement learning (MARL) enables coordinated behavior under partial observability by modeling agents as nodes and communication links as edges. While recent methods excel at learning sparse coordination graphs-determining who communicates with whom-they do not address what information should be transmitted under hard bandwidth constraints. We study this bandwidth-limited regime and show that naive dimensionality reduction consistently degrades coordination performance. Hard bandwidth constraints force selective encoding, but deterministic projections lack mechanisms to control how compression occurs. We introduce Bandwidth-constrained Variational Message Encoding (BVME), a lightweight module that treats messages as samples from learned Gaussian posteriors regularized via KL divergence to an uninformative prior. BVME's variational framework provides principled, tunable control over compression strength through interpretable hyperparameters, directly constraining the representations used for decision-making. Across SMACv1, SMACv2, and MPE benchmarks, BVME achieves comparable or superior performance while using 67--83% fewer message dimensions, with gains most pronounced on sparse graphs where message quality critically impacts coordination. Ablations reveal U-shaped sensitivity to bandwidth, with BVME excelling at extreme ratios while adding minimal overhead.
- Abstract(参考訳): グラフベースのマルチエージェント強化学習(MARL)は,ノードとしてエージェントをモデル化し,エッジとして通信リンクをモデル化することにより,部分観測可能性下での協調動作を可能にする。
近年の手法はスパースコーディネートグラフの学習に長けているが, ハードバンド幅の制約の下で伝達すべき情報には対処できない。
本研究では,この帯域幅制限方式について検討し,ナイーブ次元の低減が常に調整性能を低下させることを示す。
ハードバンド幅の制約は選択的符号化を強制するが、決定論的射影は圧縮の発生を制御するメカニズムを欠いている。
我々は,KL の発散により正規化されるガウス後部から非形式的前部まで,メッセージのサンプルとして扱う軽量モジュールであるBandwidth-Constrained Variational Message Encoding (BVME)を紹介した。
BVMEの変分フレームワークは、解釈可能なハイパーパラメータを通して圧縮強度を制御し、意思決定に使用される表現を直接制限する。
SMACv1, SMACv2, MPEベンチマーク全体で、BVMEは67~83%のメッセージディメンションを使用しながら、同等または優れたパフォーマンスを実現している。
アブレーションにより、帯域幅に対するU字型感度が明らかになり、BVMEは極端比で優れ、オーバーヘッドは最小限に抑えられる。
関連論文リスト
- BADiff: Bandwidth Adaptive Diffusion Model [55.10134744772338]
従来の拡散モデルは、下流の伝送制限によらず、一定数のデノナイジングステップを実行することで、高忠実度画像を生成する。
実際のクラウド・ツー・デバイス・シナリオでは、帯域幅の制限はしばしば重い圧縮を必要とし、微妙なテクスチャや無駄な計算が失われる。
使用可能な帯域幅から導かれる目標品質レベルに拡散モデルを条件付けする,共同エンドツーエンドのトレーニング戦略を導入する。
論文 参考訳(メタデータ) (2025-10-24T11:50:03Z) - Task-Oriented Feature Compression for Multimodal Understanding via Device-Edge Co-Inference [54.53508601749513]
本稿では,マルチモーダル理解のためのタスク指向特徴圧縮(TOFC)手法を提案する。
圧縮効率を向上させるために、視覚特徴の特性に基づいて複数のエントロピーモデルを適応的に選択する。
その結果,TOFCはデータ転送オーバーヘッドを最大52%削減し,システム遅延を最大63%削減できることがわかった。
論文 参考訳(メタデータ) (2025-03-17T08:37:22Z) - Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [66.63250537475973]
本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。
実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文 参考訳(メタデータ) (2024-07-26T02:34:25Z) - Dynamic Size Message Scheduling for Multi-Agent Communication under
Limited Bandwidth [5.590219593864609]
本稿では,動的サイズメッセージスケジューリング(DSMS)手法を提案する。
我々の貢献は、フーリエ変換に基づく圧縮技術を用いて、メッセージサイズを適応的に調整することにある。
実験の結果,DSMSは多エージェント協調作業の性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-06-16T18:33:11Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z) - Learning Task-Oriented Communication for Edge Inference: An Information
Bottleneck Approach [3.983055670167878]
ローエンドエッジ装置は、ローカルデータサンプルの抽出された特徴ベクトルを強力なエッジサーバに送信して処理する。
帯域幅が限られているため、データを低遅延推論のための情報的かつコンパクトな表現に符号化することが重要である。
特徴抽出,ソース符号化,チャネル符号化を協調的に最適化する学習型通信方式を提案する。
論文 参考訳(メタデータ) (2021-02-08T12:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。