論文の概要: Quasi-Equivalence Discovery for Zero-Shot Emergent Communication
- arxiv url: http://arxiv.org/abs/2103.08067v1
- Date: Sun, 14 Mar 2021 23:42:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 02:39:17.622207
- Title: Quasi-Equivalence Discovery for Zero-Shot Emergent Communication
- Title(参考訳): ゼロショット創発通信のための準等価ディスカバリ
- Authors: Kalesha Bullard, Douwe Kiela, Joelle Pineau, Jakob Foerster
- Abstract要約: ゼロショットコーディネーション(ZSC)を実現するための新しい問題設定と準等価探索アルゴリズムを提案する。
これらの2つの要因が参照ゲームにおいて一意に最適なZSCポリシーをもたらすことを示す。
QEDはこの設定における対称性を反復的に発見することができ、最適なZSCポリシーに収束する。
- 参考スコア(独自算出の注目度): 63.175848843466845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective communication is an important skill for enabling information
exchange in multi-agent settings and emergent communication is now a vibrant
field of research, with common settings involving discrete cheap-talk channels.
Since, by definition, these settings involve arbitrary encoding of information,
typically they do not allow for the learned protocols to generalize beyond
training partners. In contrast, in this work, we present a novel problem
setting and the Quasi-Equivalence Discovery (QED) algorithm that allows for
zero-shot coordination (ZSC), i.e., discovering protocols that can generalize
to independently trained agents. Real world problem settings often contain
costly communication channels, e.g., robots have to physically move their
limbs, and a non-uniform distribution over intents. We show that these two
factors lead to unique optimal ZSC policies in referential games, where agents
use the energy cost of the messages to communicate intent. Other-Play was
recently introduced for learning optimal ZSC policies, but requires prior
access to the symmetries of the problem. Instead, QED can iteratively discovers
the symmetries in this setting and converges to the optimal ZSC policy.
- Abstract(参考訳): 効果的なコミュニケーションはマルチエージェント環境での情報交換を可能にする重要なスキルであり、創発的コミュニケーションは活気ある研究分野であり、個別の安価トークチャネルを含む共通的な設定である。
定義上、これらの設定には任意の情報エンコーディングが含まれており、通常、学習したプロトコルがトレーニングパートナーを超えて一般化することを許さない。
対照的に、本研究では、ゼロショットコーディネーション(ZSC)を可能にする新しい問題設定と準等価ディスカバリー(QED)アルゴリズム、すなわち独立に訓練されたエージェントに一般化できるプロトコルを発見することを提案する。
現実世界の問題設定にはしばしば高価な通信チャネルが含まれており、例えばロボットは四肢を物理的に動かさなければならない。
これらの2つの要因が,エージェントが意図を伝えるためにメッセージのエネルギーコストを使用するレファレンシャルゲームにおいて,ユニークなzscポリシーをもたらすことを示す。
Other-Playは最近、最適なZSCポリシーを学ぶために導入されたが、問題の対称性に事前アクセスする必要がある。
代わりに、qedはこの設定における対称性を反復的に発見し、最適なzscポリシーに収束する。
関連論文リスト
- Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - Federated Contextual Cascading Bandits with Asynchronous Communication
and Heterogeneous Users [95.77678166036561]
繊細な通信プロトコルを用いたUPB型アルゴリズムを提案する。
同期フレームワークで達成されたものと同等のサブ線形後悔境界を与えます。
合成および実世界のデータセットに関する実証評価は、後悔と通信コストの観点から、我々のアルゴリズムの優れた性能を検証する。
論文 参考訳(メタデータ) (2024-02-26T05:31:14Z) - Learning Translations: Emergent Communication Pretraining for
Cooperative Language Acquisition [0.7832189413179361]
Emergent Communication (EC) エージェントは互いに通信することを学ぶが、彼らが開発するプロトコルはトレーニングコミュニティに特化している。
この観察は、訓練中に遭遇しないエージェントに対して堅牢なコミュニケーション戦略を学習するためのゼロショットコーディネーション(ZSC)の研究につながった。
本稿では,協調言語獲得問題(CLAP,Cooperative Language Acquisition Problem)と呼ばれる新たなAI課題を提案する。
論文 参考訳(メタデータ) (2024-02-26T02:13:36Z) - Learning to Cooperate and Communicate Over Imperfect Channels [27.241873614561538]
本稿では,エージェントが限定的かつ信頼性の低いチャネルを用いて,情報を分散的に処理・交換する協調型マルチエージェントシステムについて考察する。
提案手法では,異なる大きさのメッセージを送信することで,共有する情報の量に動的に適応することができる。
本手法は,新しい協調型桁予測環境において適応性のない手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-24T12:15:48Z) - Universally Expressive Communication in Multi-Agent Reinforcement
Learning [6.086083595135936]
与えられた通信プロトコルが任意のポリシーを表現できるかどうかという問題を考察する。
標準のGNNアプローチは表現能力に十分制限されているため,(1)一意なエージェントIDと(2)ランダムノイズによるエージェント観察の増強を検討する。
我々は,これらの手法が普遍的に表現力のあるコミュニケーションをいかに生み出すかの理論分析を行い,同一のエージェントに対する任意の行動群を対象とすることができることを証明した。
論文 参考訳(メタデータ) (2022-06-14T11:16:33Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Accelerating Federated Edge Learning via Optimized Probabilistic Device
Scheduling [57.271494741212166]
本稿では,通信時間最小化問題を定式化し,解決する。
最適化されたポリシーは、トレーニングプロセスが進むにつれて、残りの通信ラウンドの抑制から、ラウンドごとのレイテンシの低減へと、徐々に優先順位を転換している。
提案手法の有効性は,自律運転における協調的3次元目標検出のユースケースを通じて実証される。
論文 参考訳(メタデータ) (2021-07-24T11:39:17Z) - Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent
Populations [59.608216900601384]
本研究では,3次元環境下で関節を作動させることでコミュニケーションを学ぶエージェントについて検討する。
現実的な仮定、意図の非一様分布、共通知識エネルギーコストにおいて、これらのエージェントは新規パートナーに一般化するプロトコルを見つけることができることを示す。
論文 参考訳(メタデータ) (2020-10-29T19:23:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。