論文の概要: Learning to Communicate with Strangers via Channel Randomisation Methods
- arxiv url: http://arxiv.org/abs/2104.09557v1
- Date: Mon, 19 Apr 2021 18:42:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 05:09:14.419015
- Title: Learning to Communicate with Strangers via Channel Randomisation Methods
- Title(参考訳): チャネルランダム化法によるストランガーとのコミュニケーションの学習
- Authors: Dylan Cope and Nandi Schoots
- Abstract要約: コミュニケーションタスクを初めて達成するためのエージェントミーティングのパフォーマンスを向上させる2つの方法を紹介します。
これらの提案は、コミュニケーションプロトコルを生成しメッセージを送信する教師と、メッセージを解釈する生徒の2人による単純なゲームを用いてテストされる。
- 参考スコア(独自算出の注目度): 1.4502611532302039
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce two methods for improving the performance of agents meeting for
the first time to accomplish a communicative task. The methods are: (1)
`message mutation' during the generation of the communication protocol; and (2)
random permutations of the communication channel. These proposals are tested
using a simple two-player game involving a `teacher' who generates a
communication protocol and sends a message, and a `student' who interprets the
message. After training multiple agents via self-play we analyse the
performance of these agents when they are matched with a stranger, i.e. their
zero-shot communication performance. We find that both message mutation and
channel permutation positively influence performance, and we discuss their
effects.
- Abstract(参考訳): 我々は,コミュニケーションタスクを実現するために,初めてエージェントミーティングのパフォーマンスを向上させる2つの方法を紹介する。
方法は、(1)通信プロトコルの生成中における「メッセージ変異」、(2)通信チャネルのランダムな置換である。
これらの提案は、通信プロトコルを生成しメッセージを送信する「教師」と、メッセージを解釈する「生徒」を含む単純な2人プレイゲームを用いてテストされる。
複数のエージェントをセルフプレイで訓練した後、そのエージェントが見知らぬ人と一致した場合、そのエージェントのパフォーマンスを分析する。
ゼロショット通信性能。
メッセージ突然変異とチャネル置換の両方が性能に肯定的な影響を及ぼし,その効果について考察する。
関連論文リスト
- Learning Multi-Agent Communication with Contrastive Learning [3.816854668079928]
本稿では,コミュニケーション的メッセージが環境状態の異なる不完全なビューと見なされる,別の視点を紹介する。
送信したメッセージと受信したメッセージの関係を調べることで,コントラスト学習を用いてコミュニケーションを学ぶことを提案する。
通信環境において,本手法は性能と学習速度の両面で,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-03T23:51:05Z) - Inductive Bias for Emergent Communication in a Continuous Setting [0.0]
マルチエージェント強化学習環境における創発的コミュニケーションについて検討する。
連続メッセージのための優れた通信プロトコルの出現を支援するために、誘導バイアスを導入する。
論文 参考訳(メタデータ) (2023-06-06T16:15:56Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Learning Practical Communication Strategies in Cooperative Multi-Agent
Reinforcement Learning [5.539117319607963]
現実的な無線ネットワークにおける通信は、エージェントの移動量によってネットワーク条件が変化するため、信頼性が低い。
本稿では,3つの基本的な問題に対処し,実践的なコミュニケーション戦略を学ぶための枠組みを提案する。
我々は,最先端技術と比較して,ゲーム性能,収束速度,通信効率が著しく向上したことを示す。
論文 参考訳(メタデータ) (2022-09-02T22:18:43Z) - Coordinating Policies Among Multiple Agents via an Intelligent
Communication Channel [81.39444892747512]
MARL(Multi-Agent Reinforcement Learning)では、エージェントが直接通信できる特別なチャンネルがしばしば導入される。
本稿では,エージェントの集団的性能を向上させるために,エージェントが提供した信号の伝達と解釈を学習する,インテリジェントなファシリテータを通じてエージェントがコミュニケーションする手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T14:11:33Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - Learning Emergent Discrete Message Communication for Cooperative
Reinforcement Learning [36.468498804251574]
離散メッセージ通信は連続メッセージ通信に匹敵する性能を有することを示す。
エージェントに離散的なメッセージを対話的に送信できるアプローチを提案します。
論文 参考訳(メタデータ) (2021-02-24T20:44:14Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z) - On Emergent Communication in Competitive Multi-Agent Teams [116.95067289206919]
外部のエージェントチームによるパフォーマンスの競争が社会的影響として作用するかどうかを検討する。
以上の結果から,外部競争の影響により精度と一般化が向上し,コミュニケーション言語が急速に出現することが示唆された。
論文 参考訳(メタデータ) (2020-03-04T01:14:27Z) - On the interaction between supervision and self-play in emergent
communication [82.290338507106]
本研究は,2つのカテゴリの学習信号と,サンプル効率の向上を目標とする学習信号の関係について検討する。
人間のデータに基づく教師付き学習による初等訓練エージェントが,自己演奏が会話に優れていることが判明した。
論文 参考訳(メタデータ) (2020-02-04T02:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。