論文の概要: Emergent Communication under Competition
- arxiv url: http://arxiv.org/abs/2101.10276v1
- Date: Mon, 25 Jan 2021 17:58:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 19:16:54.351356
- Title: Emergent Communication under Competition
- Title(参考訳): 競争下の創発的コミュニケーション
- Authors: Michael Noukhovitch, Travis LaCroix, Angeliki Lazaridou, Aaron
Courville
- Abstract要約: 我々は,部分競合シナリオのスペクトルを調べるために,修正された送信者・受信者ゲームを導入する。
コミュニケーションは協調に比例し、部分的に競合するシナリオで起こりうることを示す。
- 参考スコア(独自算出の注目度): 10.926117869188651
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The literature in modern machine learning has only negative results for
learning to communicate between competitive agents using standard RL. We
introduce a modified sender-receiver game to study the spectrum of
partially-competitive scenarios and show communication can indeed emerge in a
competitive setting. We empirically demonstrate three key takeaways for future
research. First, we show that communication is proportional to cooperation, and
it can occur for partially competitive scenarios using standard learning
algorithms. Second, we highlight the difference between communication and
manipulation and extend previous metrics of communication to the competitive
case. Third, we investigate the negotiation game where previous work failed to
learn communication between independent agents (Cao et al., 2018). We show
that, in this setting, both agents must benefit from communication for it to
emerge; and, with a slight modification to the game, we demonstrate successful
communication between competitive agents. We hope this work overturns
misconceptions and inspires more research in competitive emergent
communication.
- Abstract(参考訳): 現代の機械学習の文献は、標準的なRLを用いた競合エージェント間のコミュニケーションを学ぶための負の結果しか得られない。
我々は、部分的に競合するシナリオのスペクトルを研究するために修正された送信受信機ゲームを導入し、通信が競争環境で実際に現れることを示す。
我々は、将来の研究のための3つの重要なポイントを実証的に示す。
まず,コミュニケーションが協調に比例することを示すとともに,標準学習アルゴリズムを用いた部分的競争シナリオに適用できることを示す。
第2に,コミュニケーションと操作の違いを強調し,これまでのコミュニケーションの指標を競合事例に拡張する。
第3に,従来の作業が独立したエージェント間のコミュニケーションを学ばなかった交渉ゲームについて検討する(Cao et al., 2018)。
この環境では、双方のエージェントがコミュニケーションの恩恵を受けなければならないことを示し、ゲームにわずかな修正を加えることで、競合エージェント間のコミュニケーションが成功することを示す。
この研究が誤解を覆し、競争力のある創発的コミュニケーションのさらなる研究を促すことを願っている。
関連論文リスト
- Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Emergent Communication: Generalization and Overfitting in Lewis Games [53.35045559317384]
ルイスシグナリングゲーム(Lewis signaling game)は、言語の出現をシミュレートする単純なコミュニケーションゲームの一種である。
これらのゲームでは、2人のエージェントが協調的なタスクを解決するために通信プロトコルに合意しなければなりません。
これまでの研究によると、強化学習でこのゲームをプレイするように訓練されたエージェントは、望ましくない性質を示す言語を開発する傾向がある。
論文 参考訳(メタデータ) (2022-09-30T09:50:46Z) - The Enforcers: Consistent Sparse-Discrete Methods for Constraining
Informative Emergent Communication [5.432350993419402]
コミュニケーションは、エージェントが目標を達成するために協力することを可能にする。
疎間コミュニケーションの学習における最近の研究は、特に協調作業において、コミュニケーションの減少のコストが報酬の減少につながるような、高分散トレーニングに悩まされている。
本研究は、コミュニケーションの減少による報酬の損失を抑え、差別に対するペナルティを排除し、上記の課題に対処する。
論文 参考訳(メタデータ) (2022-01-19T07:31:06Z) - Preference Communication in Multi-Objective Normal-Form Games [3.8099752264464883]
マルチオブジェクト環境において,複数のエージェントが同時に学習する問題について検討する。
協調型および自己関心型のコミュニケーションのための4つの新しい嗜好通信プロトコルを導入する。
嗜好コミュニケーションは学習過程を劇的に変化させ,循環的ナッシュ均衡の出現につながることが判明した。
論文 参考訳(メタデータ) (2021-11-17T15:30:41Z) - Mixed Cooperative-Competitive Communication Using Multi-Agent
Reinforcement Learning [0.0]
混合協調競争環境に微分可能なエージェント間学習(DIAL)を適用した。
私たちは、チームにとってプライベートなコミュニケーションと、他のチームによって過度に耳を傾けるコミュニケーションの間のパフォーマンスの違いに注目します。
論文 参考訳(メタデータ) (2021-10-29T13:25:07Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Incorporating Rivalry in Reinforcement Learning for a Competitive Game [65.2200847818153]
本研究は、競合する社会的影響に基づく新しい学習メカニズムの提供に焦点を当てる。
本研究は,競争競合の概念に基づいて,これらのエージェントの評価を人的視点から変えられるかを検討することを目的とする。
論文 参考訳(メタデータ) (2020-11-02T21:54:18Z) - Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent
Populations [59.608216900601384]
本研究では,3次元環境下で関節を作動させることでコミュニケーションを学ぶエージェントについて検討する。
現実的な仮定、意図の非一様分布、共通知識エネルギーコストにおいて、これらのエージェントは新規パートナーに一般化するプロトコルを見つけることができることを示す。
論文 参考訳(メタデータ) (2020-10-29T19:23:10Z) - Pow-Wow: A Dataset and Study on Collaborative Communication in Pommerman [12.498028338281625]
多エージェント学習では、エージェントは成功するために互いに調整する必要がある。人間にとって、この調整は通常、言語の使用によって行われる。
Pow-Wowは、ゴール指向の人間コミュニケーションを測る新しいデータセットである。
我々は,効果的なゲーム戦略をもたらすコミュニケーションの種類を分析し,それに応じて注釈を付けるとともに,コミュニケーションの傾向がゲーム結果に与える影響をコーパスレベルで統計分析する。
論文 参考訳(メタデータ) (2020-09-13T07:11:37Z) - On Emergent Communication in Competitive Multi-Agent Teams [116.95067289206919]
外部のエージェントチームによるパフォーマンスの競争が社会的影響として作用するかどうかを検討する。
以上の結果から,外部競争の影響により精度と一般化が向上し,コミュニケーション言語が急速に出現することが示唆された。
論文 参考訳(メタデータ) (2020-03-04T01:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。