論文の概要: Generalizing Emergent Communication
- arxiv url: http://arxiv.org/abs/2001.01772v3
- Date: Mon, 14 Dec 2020 23:40:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 02:26:52.025194
- Title: Generalizing Emergent Communication
- Title(参考訳): 創発的コミュニケーションの一般化
- Authors: Thomas A. Unger, Elia Bruni
- Abstract要約: 我々は,確立された深層強化学習技術は,基盤となる個別通信プロトコルの出現を動機付けるのに十分である,という仮説を検証した。
この結果から, 適切な環境インセンティブを提供することにより, 実際に回避できることが示唆された。
- 参考スコア(独自算出の注目度): 12.08369037936121
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We converted the recently developed BabyAI grid world platform to a
sender/receiver setup in order to test the hypothesis that established deep
reinforcement learning techniques are sufficient to incentivize the emergence
of a grounded discrete communication protocol between generalized agents. This
is in contrast to previous experiments that employed straight-through
estimation or specialized inductive biases. Our results show that these can
indeed be avoided, by instead providing proper environmental incentives.
Moreover, they show that a longer interval between communications incentivized
more abstract semantics. In some cases, the communicating agents adapted to new
environments more quickly than a monolithic agent, showcasing the potential of
emergent communication for transfer learning and generalization in general.
- Abstract(参考訳): 我々は,最近開発されたbabyai grid world platformを送信者/受信者設定に変換し,確立された深層強化学習技術が一般化エージェント間の接地離散通信プロトコルの出現を動機づけるのに十分な仮説を検証した。
これは、ストレートスルー推定や特殊帰納バイアスを用いた以前の実験とは対照的である。
この結果から, 適切な環境インセンティブを提供することにより, 実際に回避できることが示唆された。
さらに、コミュニケーション間の長い間隔がより抽象的な意味論にインセンティブを与えることを示した。
ある場合には、通信エージェントはモノリシックエージェントよりも早く新しい環境に適応し、転送学習や一般化のための創発的なコミュニケーションの可能性を示した。
関連論文リスト
- Bidirectional Emergent Language in Situated Environments [4.950411915351642]
マルチエージェントポンとコレクターの2つの新しい協調環境を紹介した。
最適なパフォーマンスには通信プロトコルの出現が必要ですが、適度な成功はそれなしで達成できます。
エージェントは意味のあるメッセージのみを生成し、調整なしでは成功できない状態の受信メッセージに作用する。
論文 参考訳(メタデータ) (2024-08-26T21:25:44Z) - Any-Shift Prompting for Generalization over Distributions [66.29237565901734]
即時学習におけるトレーニングとテスト分布の関係を考察する一般的な確率的推論フレームワークである「任意のシフトプロンプト」を提案する。
このフレームワーク内では、テストプロンプトが分散関係を利用して、CLIPイメージ言語モデルのトレーニングからテストディストリビューションへの一般化を導く。
ネットワークは、トレーニング情報とテスト情報の両方をフィードフォワードパスに組み込んだ調整されたテストプロンプトを生成し、テスト時の追加のトレーニングコストを回避する。
論文 参考訳(メタデータ) (2024-02-15T16:53:42Z) - Inductive Bias for Emergent Communication in a Continuous Setting [0.0]
マルチエージェント強化学習環境における創発的コミュニケーションについて検討する。
連続メッセージのための優れた通信プロトコルの出現を支援するために、誘導バイアスを導入する。
論文 参考訳(メタデータ) (2023-06-06T16:15:56Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Color Overmodification Emerges from Data-Driven Learning and Pragmatic
Reasoning [53.088796874029974]
話者の指示表現は、実践的な言語使用の性質を照らし出すのに役立つ方法で、コミュニケーションイデアルから逸脱していることを示す。
ニューラルネットワークを学習エージェントとして採用することにより、過度な修正は、頻度の低い、あるいは正常な環境特性に結びつく可能性が高いことを示す。
論文 参考訳(メタデータ) (2022-05-18T18:42:43Z) - A Decentralized Communication Framework based on Dual-Level Recurrence
for Multi-Agent Reinforcement Learning [5.220940151628735]
マルチエージェントシステムのためのデュアルレベルリカレント通信フレームワークを提案する。
第1の再発は通信シーケンスで発生し、エージェント間の通信データを送信するために使用される。
第2の再発は、時系列に基づいて、各エージェントの履歴観測を組み合わせる。
論文 参考訳(メタデータ) (2022-02-22T01:36:59Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Emergent Discrete Communication in Semantic Spaces [3.2280079436668996]
本稿では,学習された連続空間から導出される離散トークンを介してエージェントが通信できるようにするニューラルエージェントアーキテクチャを提案する。
決定論の枠組みでは、我々の手法は幅広いシナリオでコミュニケーションを最適化するが、一方1ホットトークンは制約的な仮定の下では最適である。
セルフプレイ実験では、訓練されたエージェントが意味論的に意味のある方法でトークンをクラスタリングすることを学び、ノイズの多い環境でコミュニケーションできることを検証する。
論文 参考訳(メタデータ) (2021-08-04T03:32:48Z) - Adversarial Attacks On Multi-Agent Communication [80.4392160849506]
現代の自律システムはすぐに大規模に展開され、協調型マルチエージェントシステムの可能性を広げる。
このような利点は、セキュリティ侵害に対して脆弱であることが示されている通信チャネルに大きく依存している。
本稿では,エージェントが学習した中間表現を共有してコミュニケーションする新しいマルチエージェント環境において,このような攻撃を探索する。
論文 参考訳(メタデータ) (2021-01-17T00:35:26Z) - Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent
Populations [59.608216900601384]
本研究では,3次元環境下で関節を作動させることでコミュニケーションを学ぶエージェントについて検討する。
現実的な仮定、意図の非一様分布、共通知識エネルギーコストにおいて、これらのエージェントは新規パートナーに一般化するプロトコルを見つけることができることを示す。
論文 参考訳(メタデータ) (2020-10-29T19:23:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。