論文の概要: Implicit Communication as Minimum Entropy Coupling
- arxiv url: http://arxiv.org/abs/2107.08295v1
- Date: Sat, 17 Jul 2021 17:44:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-20 14:48:39.173008
- Title: Implicit Communication as Minimum Entropy Coupling
- Title(参考訳): 最小エントロピー結合としての暗黙的通信
- Authors: Samuel Sokota, Christian Schroeder de Witt, Maximilian Igl, Luisa
Zintgraf, Philip Torr, Shimon Whiteson, Jakob Foerster
- Abstract要約: 多くの共通ペイオフゲームにおいて、優れたパフォーマンスを達成するためには、プレイヤーは暗黙的にプライベート情報を通信するためのプロトコルを開発する必要がある。
我々は、暗黙的な参照ゲーム(暗黙的なコミュニケーションによる難易度)と呼ばれる、部分的に観察可能なコモンペイオフゲームのクラスを特定する。
提案手法は,非常に大きなメッセージ空間を持つ設定において,性能の高い暗黙的通信プロトコルを検出できることを示す。
- 参考スコア(独自算出の注目度): 42.13333133772116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many common-payoff games, achieving good performance requires players to
develop protocols for communicating their private information implicitly --
i.e., using actions that have non-communicative effects on the environment.
Multi-agent reinforcement learning practitioners typically approach this
problem using independent learning methods in the hope that agents will learn
implicit communication as a byproduct of expected return maximization.
Unfortunately, independent learning methods are incapable of doing this in many
settings. In this work, we isolate the implicit communication problem by
identifying a class of partially observable common-payoff games, which we call
implicit referential games, whose difficulty can be attributed to implicit
communication. Next, we introduce a principled method based on minimum entropy
coupling that leverages the structure of implicit referential games, yielding a
new perspective on implicit communication. Lastly, we show that this method can
discover performant implicit communication protocols in settings with very
large spaces of messages.
- Abstract(参考訳): 多くの共通ペイオフゲームにおいて、優れたパフォーマンスを達成するためには、プレイヤーは暗黙的にプライベート情報を通信するためのプロトコルを開発する必要がある。
マルチエージェント強化学習実践者は、エージェントが期待されるリターン最大化の副産物として暗黙のコミュニケーションを学ぶことを期待して、独立学習手法を用いてこの問題にアプローチする。
残念ながら、独立した学習方法は、多くの設定でこれを行うことができない。
本研究では,暗黙的参照ゲーム(暗黙的参照ゲーム)と呼ばれる,部分的に観察可能な共通支払いゲームのクラスを識別することで,暗黙的コミュニケーション問題を分離する。
次に,暗黙的参照ゲームの構造を利用した最小エントロピー結合に基づく原理的手法を導入し,暗黙的コミュニケーションに対する新たな視点を得る。
最後に、非常に大きなメッセージ空間を持つ設定において、この手法は性能の高い暗黙的な通信プロトコルを発見できることを示す。
関連論文リスト
- Learning Multi-Agent Communication with Contrastive Learning [3.816854668079928]
本稿では,コミュニケーション的メッセージが環境状態の異なる不完全なビューと見なされる,別の視点を紹介する。
送信したメッセージと受信したメッセージの関係を調べることで,コントラスト学習を用いてコミュニケーションを学ぶことを提案する。
通信環境において,本手法は性能と学習速度の両面で,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-03T23:51:05Z) - Cognitive Semantic Communication Systems Driven by Knowledge Graph:
Principle, Implementation, and Performance Evaluation [74.38561925376996]
単一ユーザと複数ユーザのコミュニケーションシナリオに対して,認知意味コミュニケーションフレームワークが2つ提案されている。
知識グラフから推論規則をマイニングすることにより,効果的な意味補正アルゴリズムを提案する。
マルチユーザ認知型セマンティックコミュニケーションシステムにおいて,異なるユーザのメッセージを識別するために,メッセージ復元アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-15T12:01:43Z) - On the Role of Emergent Communication for Social Learning in Multi-Agent
Reinforcement Learning [0.0]
社会学習は、専門家からのヒントを使って、異質なポリシーを整列し、サンプルの複雑さを減らし、部分的に観察可能なタスクを解決する。
本稿では,情報ボトルネックに基づく教師なし手法を提案する。
論文 参考訳(メタデータ) (2023-02-28T03:23:27Z) - Emergent Quantized Communication [34.31732248872158]
本稿では,メッセージの量子化という,離散的なコミュニケーションを実現するための代替手法を提案する。
メッセージの量子化により、モデルのエンドツーエンドのトレーニングが可能になり、複数のセットアップで優れたパフォーマンスを実現します。
論文 参考訳(メタデータ) (2022-11-04T12:39:45Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Emergent Communication: Generalization and Overfitting in Lewis Games [53.35045559317384]
ルイスシグナリングゲーム(Lewis signaling game)は、言語の出現をシミュレートする単純なコミュニケーションゲームの一種である。
これらのゲームでは、2人のエージェントが協調的なタスクを解決するために通信プロトコルに合意しなければなりません。
これまでの研究によると、強化学習でこのゲームをプレイするように訓練されたエージェントは、望ましくない性質を示す言語を開発する傾向がある。
論文 参考訳(メタデータ) (2022-09-30T09:50:46Z) - Learning to Ground Decentralized Multi-Agent Communication with
Contrastive Learning [1.116812194101501]
我々は,環境状態の異なる不完全な視点として,エージェント間で送信されるコミュニケーションメッセージに代替的な視点を導入する。
本稿では,与えられた軌跡のメッセージ間の相互情報を自己管理的に最大化することにより,共通言語の出現を誘導する簡単な手法を提案する。
論文 参考訳(メタデータ) (2022-03-07T12:41:32Z) - The Enforcers: Consistent Sparse-Discrete Methods for Constraining
Informative Emergent Communication [5.432350993419402]
コミュニケーションは、エージェントが目標を達成するために協力することを可能にする。
疎間コミュニケーションの学習における最近の研究は、特に協調作業において、コミュニケーションの減少のコストが報酬の減少につながるような、高分散トレーニングに悩まされている。
本研究は、コミュニケーションの減少による報酬の損失を抑え、差別に対するペナルティを排除し、上記の課題に対処する。
論文 参考訳(メタデータ) (2022-01-19T07:31:06Z) - Quasi-Equivalence Discovery for Zero-Shot Emergent Communication [63.175848843466845]
ゼロショットコーディネーション(ZSC)を実現するための新しい問題設定と準等価探索アルゴリズムを提案する。
これらの2つの要因が参照ゲームにおいて一意に最適なZSCポリシーをもたらすことを示す。
QEDはこの設定における対称性を反復的に発見することができ、最適なZSCポリシーに収束する。
論文 参考訳(メタデータ) (2021-03-14T23:42:37Z) - Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent
Populations [59.608216900601384]
本研究では,3次元環境下で関節を作動させることでコミュニケーションを学ぶエージェントについて検討する。
現実的な仮定、意図の非一様分布、共通知識エネルギーコストにおいて、これらのエージェントは新規パートナーに一般化するプロトコルを見つけることができることを示す。
論文 参考訳(メタデータ) (2020-10-29T19:23:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。