論文の概要: Emergent Communication: Generalization and Overfitting in Lewis Games
- arxiv url: http://arxiv.org/abs/2209.15342v1
- Date: Fri, 30 Sep 2022 09:50:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 16:16:37.152519
- Title: Emergent Communication: Generalization and Overfitting in Lewis Games
- Title(参考訳): 創発的コミュニケーション:ルイスゲームにおける一般化とオーバーフィッティング
- Authors: Mathieu Rita, Corentin Tallec, Paul Michel, Jean-Bastien Grill,
Olivier Pietquin, Emmanuel Dupoux, Florian Strub
- Abstract要約: ルイスシグナリングゲーム(Lewis signaling game)は、言語の出現をシミュレートする単純なコミュニケーションゲームの一種である。
これらのゲームでは、2人のエージェントが協調的なタスクを解決するために通信プロトコルに合意しなければなりません。
これまでの研究によると、強化学習でこのゲームをプレイするように訓練されたエージェントは、望ましくない性質を示す言語を開発する傾向がある。
- 参考スコア(独自算出の注目度): 53.35045559317384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lewis signaling games are a class of simple communication games for
simulating the emergence of language. In these games, two agents must agree on
a communication protocol in order to solve a cooperative task. Previous work
has shown that agents trained to play this game with reinforcement learning
tend to develop languages that display undesirable properties from a linguistic
point of view (lack of generalization, lack of compositionality, etc). In this
paper, we aim to provide better understanding of this phenomenon by
analytically studying the learning problem in Lewis games. As a core
contribution, we demonstrate that the standard objective in Lewis games can be
decomposed in two components: a co-adaptation loss and an information loss.
This decomposition enables us to surface two potential sources of overfitting,
which we show may undermine the emergence of a structured communication
protocol. In particular, when we control for overfitting on the co-adaptation
loss, we recover desired properties in the emergent languages: they are more
compositional and generalize better.
- Abstract(参考訳): ルイスシグナリングゲーム(Lewis signaling game)は、言語の出現をシミュレートする単純なコミュニケーションゲームの一種である。
これらのゲームでは、2人のエージェントが協調的なタスクを解決するために通信プロトコルに合意しなければなりません。
以前の研究では、強化学習でこのゲームをする訓練を受けたエージェントは、言語的な観点から望ましくない特性を示す言語を開発する傾向がある(一般化の欠如、構成性の欠如など)。
本稿ではルイスゲームにおける学習問題を解析的に研究することで,この現象の理解を深めることを目的とする。
核となる貢献として,lewisゲームにおける標準的な目的が,共適応損失と情報損失の2つの構成要素に分解できることを実証する。
この分解によって2つの潜在的なオーバーフィッティング源が表面化できるため、構造化通信プロトコルの出現を損なう可能性がある。
特に、共適応損失のオーバーフィットを制御する場合には、創発的言語の望ましい特性を回復します。
関連論文リスト
- On the Correspondence between Compositionality and Imitation in Emergent
Neural Communication [1.4610038284393165]
我々の研究は、ディープ・ニューラル・エージェントがプレイするルイス・ゲームにおける構成性と模倣の関係を探求する。
教師付き学習は平均的な言語を作り出す傾向があり、強化学習はより構成的な言語に対する選択的な圧力をもたらす。
論文 参考訳(メタデータ) (2023-05-22T11:41:29Z) - EC^2: Emergent Communication for Embodied Control [72.99894347257268]
エージェントはマルチモーダル・プレトレーニングを活用して、新しい環境でどのように振る舞うかを素早く学ぶ必要がある。
本稿では,数発のエンボディドコントロールのためのビデオ言語表現を事前学習するための新しいスキームであるEmergent Communication for Embodied Control (EC2)を提案する。
EC2は、タスク入力としてビデオとテキストの両方の従来のコントラスト学習手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-04-19T06:36:02Z) - Reasoning about Causality in Games [63.930126666879396]
因果推論とゲーム理論推論は人工知能の基本的なトピックである。
本稿では,エージェントの意思決定ルールとゲームを管理する分布の依存関係をエンコードするメカニケードゲームを紹介する。
因果ゲームと他の形式主義の対応を記述し、他の因果ゲームやゲーム理論モデルがサポートしていない問合せにどのように因果ゲームが使えるかを説明する。
論文 参考訳(メタデータ) (2023-01-05T22:47:28Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Implicit Communication as Minimum Entropy Coupling [42.13333133772116]
多くの共通ペイオフゲームにおいて、優れたパフォーマンスを達成するためには、プレイヤーは暗黙的にプライベート情報を通信するためのプロトコルを開発する必要がある。
我々は、暗黙的な参照ゲーム(暗黙的なコミュニケーションによる難易度)と呼ばれる、部分的に観察可能なコモンペイオフゲームのクラスを特定する。
提案手法は,非常に大きなメッセージ空間を持つ設定において,性能の高い暗黙的通信プロトコルを検出できることを示す。
論文 参考訳(メタデータ) (2021-07-17T17:44:30Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - Emergent Communication of Generalizations [13.14792537601313]
共有された視覚的コンテキストにおける1つのオブジェクトのコミュニケーションは、過度に適合する傾向があり、具体的な参照を超えて、言語が役に立つことを奨励しない、と我々は主張する。
抽象的な視覚概念を表すオブジェクトの集合上での通信一般化を必要とするゲームを提案する。
これらのゲームは学習言語の体系性と解釈可能性を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-04T19:02:18Z) - Incorporating Pragmatic Reasoning Communication into Emergent Language [38.134221799334426]
我々は、言語コミュニケーションのダイナミクスを、かなり異なるインテリジェンスとインテリジェンスレベルに沿って研究する。
本稿では,短期的相互推論に基づく実用主義と長期言語創発主義を組み合わせた計算モデルを提案する。
我々の結果は、より自然で正確で、堅牢で、きめ細かな、簡潔な発話を実現するための道を開くことの重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2020-06-07T10:31:06Z) - Towards Graph Representation Learning in Emergent Communication [37.8523331078468]
我々は,マルチエージェントシステムにおける言語進化と協調を支援するために,グラフ畳み込みネットワークを利用する。
画像ベースの参照ゲームに動機づけられた,複雑度の異なるグラフ参照ゲームを提案する。
出現した通信プロトコルは堅牢であり、エージェントはゲームの変動の真の要因を明らかにし、トレーニング中に遭遇したサンプルを超えて一般化することを学ぶ。
論文 参考訳(メタデータ) (2020-01-24T15:55:59Z) - Emergence of Pragmatics from Referential Game between Theory of Mind
Agents [64.25696237463397]
エージェントが手書きのルールを指定せずに「行間を読む」能力を自発的に学習するアルゴリズムを提案する。
協調型マルチエージェント教育状況における心の理論(ToM)を統合し,適応型強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-21T19:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。