論文の概要: Learning what to say and how precisely: Efficient Communication via Differentiable Discrete Communication Learning
- arxiv url: http://arxiv.org/abs/2511.01554v1
- Date: Mon, 03 Nov 2025 13:16:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.270229
- Title: Learning what to say and how precisely: Efficient Communication via Differentiable Discrete Communication Learning
- Title(参考訳): 正確に何を言うべきかを学習する:識別可能な離散的コミュニケーション学習による効率的なコミュニケーション
- Authors: Aditya Kapoor, Yash Bhisikar, Benjamin Freed, Jan Peters, Mingfei Sun,
- Abstract要約: 離散メッセージのエンドツーエンド最適化のためのフレームワークを開発する。
タスク性能の整合や超過を図りながら、帯域幅を桁違いに減らすことを示す。
- 参考スコア(独自算出の注目度): 14.221641613518633
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective communication in multi-agent reinforcement learning (MARL) is critical for success but constrained by bandwidth, yet past approaches have been limited to complex gating mechanisms that only decide \textit{whether} to communicate, not \textit{how precisely}. Learning to optimize message precision at the bit-level is fundamentally harder, as the required discretization step breaks gradient flow. We address this by generalizing Differentiable Discrete Communication Learning (DDCL), a framework for end-to-end optimization of discrete messages. Our primary contribution is an extension of DDCL to support unbounded signals, transforming it into a universal, plug-and-play layer for any MARL architecture. We verify our approach with three key results. First, through a qualitative analysis in a controlled environment, we demonstrate \textit{how} agents learn to dynamically modulate message precision according to the informational needs of the task. Second, we integrate our variant of DDCL into four state-of-the-art MARL algorithms, showing it reduces bandwidth by over an order of magnitude while matching or exceeding task performance. Finally, we provide direct evidence for the \enquote{Bitter Lesson} in MARL communication: a simple Transformer-based policy leveraging DDCL matches the performance of complex, specialized architectures, questioning the necessity of bespoke communication designs.
- Abstract(参考訳): マルチエージェント強化学習(MARL)における効果的なコミュニケーションは、成功には不可欠であるが、帯域幅に制約がある。
ビットレベルでのメッセージの精度を最適化する学習は、必要な離散化ステップが勾配の流れを壊すため、基本的に困難である。
我々は、離散メッセージのエンドツーエンド最適化のためのフレームワークであるDDCLを一般化することで、この問題に対処する。
我々の主な貢献は、非有界信号をサポートするDDCLの拡張であり、任意のMARLアーキテクチャのための普遍的なプラグアンドプレイ層に変換する。
アプローチを3つの重要な結果で検証する。
まず、制御された環境における定性的な分析を通して、タスクの情報要求に応じてメッセージの精度を動的に調整することを学ぶ。
第2に、DDCLの変種を4つの最先端MARLアルゴリズムに統合し、タスク性能の整合や超越を図りながら、帯域幅を桁違いに削減することを示す。
MARL通信における「enquote{Bitter Lesson}」の直接的な証拠として、DDCLを利用したシンプルなトランスフォーマーベースのポリシーは、複雑な特殊なアーキテクチャの性能と一致し、疎結合な通信設計の必要性を疑問視する。
関連論文リスト
- Latent Space Alignment for AI-Native MIMO Semantic Communications [11.185200213307208]
本稿では,意味コミュニケーションにおける意味的ミスマッチに対処する新しい手法を提案する。
ニューラルネットワークベースのモデルは、電力予算と複雑さの制約の下でセマンティックプリコーダ/デコーダを学ぶ。
目的指向のセマンティックコミュニケーションシナリオにおいて,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2025-07-22T15:16:18Z) - Harnessing Large Language Models for Knowledge Graph Question Answering via Adaptive Multi-Aspect Retrieval-Augmentation [81.18701211912779]
本稿では,KG(Amar)フレームワーク上での適応型マルチアスペクト検索手法を提案する。
この方法は、エンティティ、リレーション、サブグラフを含む知識を検索し、検索した各テキストを即時埋め込みに変換する。
提案手法は2つの共通データセットに対して最先端の性能を達成した。
論文 参考訳(メタデータ) (2024-12-24T16:38:04Z) - Multi-Level Optimal Transport for Universal Cross-Tokenizer Knowledge Distillation on Language Models [81.74999702045339]
マルチレベル最適輸送(MultiLevelOT)は、普遍的なクロストケナイザー知識蒸留のための最適な輸送を促進する新しいアプローチである。
本手法は,教師と生徒のロジット分布をトークンレベルとシーケンスレベルの両方で整列する。
トークンレベルでは、MultiLevelOTはグローバルとローカルの両方の情報を統合する。
論文 参考訳(メタデータ) (2024-12-19T04:51:06Z) - Text-Video Retrieval with Global-Local Semantic Consistent Learning [122.15339128463715]
我々は,シンプルで効果的なグローバル局所意味的一貫性学習(GLSCL)を提案する。
GLSCLは、テキストビデオ検索のためのモダリティをまたいだ潜在共有セマンティクスを活用する。
本手法はSOTAと同等の性能を実現し,計算コストの約220倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-05-21T11:59:36Z) - Context-aware Communication for Multi-agent Reinforcement Learning [6.109127175562235]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文 参考訳(メタデータ) (2023-12-25T03:33:08Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。