論文の概要: Learning what to say and how precisely: Efficient Communication via Differentiable Discrete Communication Learning
- arxiv url: http://arxiv.org/abs/2511.01554v1
- Date: Mon, 03 Nov 2025 13:16:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.270229
- Title: Learning what to say and how precisely: Efficient Communication via Differentiable Discrete Communication Learning
- Title(参考訳): 正確に何を言うべきかを学習する:識別可能な離散的コミュニケーション学習による効率的なコミュニケーション
- Authors: Aditya Kapoor, Yash Bhisikar, Benjamin Freed, Jan Peters, Mingfei Sun,
- Abstract要約: 離散メッセージのエンドツーエンド最適化のためのフレームワークを開発する。
タスク性能の整合や超過を図りながら、帯域幅を桁違いに減らすことを示す。
- 参考スコア(独自算出の注目度): 14.221641613518633
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective communication in multi-agent reinforcement learning (MARL) is critical for success but constrained by bandwidth, yet past approaches have been limited to complex gating mechanisms that only decide \textit{whether} to communicate, not \textit{how precisely}. Learning to optimize message precision at the bit-level is fundamentally harder, as the required discretization step breaks gradient flow. We address this by generalizing Differentiable Discrete Communication Learning (DDCL), a framework for end-to-end optimization of discrete messages. Our primary contribution is an extension of DDCL to support unbounded signals, transforming it into a universal, plug-and-play layer for any MARL architecture. We verify our approach with three key results. First, through a qualitative analysis in a controlled environment, we demonstrate \textit{how} agents learn to dynamically modulate message precision according to the informational needs of the task. Second, we integrate our variant of DDCL into four state-of-the-art MARL algorithms, showing it reduces bandwidth by over an order of magnitude while matching or exceeding task performance. Finally, we provide direct evidence for the \enquote{Bitter Lesson} in MARL communication: a simple Transformer-based policy leveraging DDCL matches the performance of complex, specialized architectures, questioning the necessity of bespoke communication designs.
- Abstract(参考訳): マルチエージェント強化学習(MARL)における効果的なコミュニケーションは、成功には不可欠であるが、帯域幅に制約がある。
ビットレベルでのメッセージの精度を最適化する学習は、必要な離散化ステップが勾配の流れを壊すため、基本的に困難である。
我々は、離散メッセージのエンドツーエンド最適化のためのフレームワークであるDDCLを一般化することで、この問題に対処する。
我々の主な貢献は、非有界信号をサポートするDDCLの拡張であり、任意のMARLアーキテクチャのための普遍的なプラグアンドプレイ層に変換する。
アプローチを3つの重要な結果で検証する。
まず、制御された環境における定性的な分析を通して、タスクの情報要求に応じてメッセージの精度を動的に調整することを学ぶ。
第2に、DDCLの変種を4つの最先端MARLアルゴリズムに統合し、タスク性能の整合や超越を図りながら、帯域幅を桁違いに削減することを示す。
MARL通信における「enquote{Bitter Lesson}」の直接的な証拠として、DDCLを利用したシンプルなトランスフォーマーベースのポリシーは、複雑な特殊なアーキテクチャの性能と一致し、疎結合な通信設計の必要性を疑問視する。
関連論文リスト
- SC-GIR: Goal-oriented Semantic Communication via Invariant Representation Learning [59.45312293893698]
目標指向セマンティックコミュニケーション(SC)は,タスクの意味情報のみを伝達することで,コミュニケーションシステムに革命をもたらすことを目的としている。
画像伝送のためのSC-GIR(Goal-oriented Invariant Representation-based SC)という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-01T04:29:43Z) - Latent Space Alignment for AI-Native MIMO Semantic Communications [11.185200213307208]
本稿では,意味コミュニケーションにおける意味的ミスマッチに対処する新しい手法を提案する。
ニューラルネットワークベースのモデルは、電力予算と複雑さの制約の下でセマンティックプリコーダ/デコーダを学ぶ。
目的指向のセマンティックコミュニケーションシナリオにおいて,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2025-07-22T15:16:18Z) - Communication-Efficient Module-Wise Federated Learning for Grasp Pose Detection in Cluttered Environments [10.63791848873399]
本稿では,Graspのポーズ検出のためのモジュールワイド・フェデレート・ラーニング(FL)フレームワークを提案する。
FLはプライバシ保護ソリューションを提供するが、そのGPDへの応用は、大規模なモデルの通信オーバーヘッドによって妨げられている。
本研究は、分散化方式で、堅牢で一般化されたGPDモデルを訓練するための通信効率のよいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-08T10:40:49Z) - Semantic Communication in Dynamic Channel Scenarios: Collaborative Optimization of Dual-Pipeline Joint Source-Channel Coding and Personalized Federated Learning [11.830276582141096]
複数のユーザを持つ複雑なネットワークトポロジでは、クライアントデータとチャネル状態情報(CSI)の組み合わせは、既存のセマンティック通信モデルに重大な課題をもたらす。
本稿では,チャネル認識モデルに基づくパーソナライズド・セマンティック・コミュニケーション・モデルを提案する。
本研究では,非帯域幅ロス関数の最適化ギャップをゼロにするフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-18T10:02:22Z) - Harnessing Large Language Models for Knowledge Graph Question Answering via Adaptive Multi-Aspect Retrieval-Augmentation [81.18701211912779]
本稿では,KG(Amar)フレームワーク上での適応型マルチアスペクト検索手法を提案する。
この方法は、エンティティ、リレーション、サブグラフを含む知識を検索し、検索した各テキストを即時埋め込みに変換する。
提案手法は2つの共通データセットに対して最先端の性能を達成した。
論文 参考訳(メタデータ) (2024-12-24T16:38:04Z) - Multi-Level Optimal Transport for Universal Cross-Tokenizer Knowledge Distillation on Language Models [81.74999702045339]
マルチレベル最適輸送(MultiLevelOT)は、普遍的なクロストケナイザー知識蒸留のための最適な輸送を促進する新しいアプローチである。
本手法は,教師と生徒のロジット分布をトークンレベルとシーケンスレベルの両方で整列する。
トークンレベルでは、MultiLevelOTはグローバルとローカルの両方の情報を統合する。
論文 参考訳(メタデータ) (2024-12-19T04:51:06Z) - Text-Video Retrieval with Global-Local Semantic Consistent Learning [122.15339128463715]
我々は,シンプルで効果的なグローバル局所意味的一貫性学習(GLSCL)を提案する。
GLSCLは、テキストビデオ検索のためのモダリティをまたいだ潜在共有セマンティクスを活用する。
本手法はSOTAと同等の性能を実現し,計算コストの約220倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-05-21T11:59:36Z) - Context-aware Communication for Multi-agent Reinforcement Learning [6.109127175562235]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文 参考訳(メタデータ) (2023-12-25T03:33:08Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z) - CosSGD: Nonlinear Quantization for Communication-efficient Federated
Learning [62.65937719264881]
フェデレーション学習は、これらのクライアントのローカルデータを中央サーバに転送することなく、クライアント間での学習を促進する。
圧縮勾配降下のための非線形量子化を提案し、フェデレーションラーニングで容易に利用することができる。
本システムは,訓練過程の収束と精度を維持しつつ,通信コストを最大3桁まで削減する。
論文 参考訳(メタデータ) (2020-12-15T12:20:28Z) - Communication-Efficient and Distributed Learning Over Wireless Networks:
Principles and Applications [55.65768284748698]
機械学習(ML)は、第5世代(5G)通信システムなどのための有望なイネーブルである。
本稿では、関連するコミュニケーションとMLの原則を概観し、選択したユースケースでコミュニケーション効率と分散学習フレームワークを提示することを目的とする。
論文 参考訳(メタデータ) (2020-08-06T12:37:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。