論文の概要: Learning to cooperate: Emergent communication in multi-agent navigation
- arxiv url: http://arxiv.org/abs/2004.01097v2
- Date: Tue, 30 Jun 2020 15:13:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 09:29:35.053514
- Title: Learning to cooperate: Emergent communication in multi-agent navigation
- Title(参考訳): 協調学習:マルチエージェントナビゲーションにおける創発的コミュニケーション
- Authors: Ivana Kaji\'c, Eser Ayg\"un and Doina Precup
- Abstract要約: 本稿では,協調ナビゲーションタスクを行うエージェントが,解釈可能な通信プロトコルを学ぶことを示す。
エージェントのポリシーの分析により、創発的信号が状態空間を空間的にクラスタリングすることが明らかになった。
エージェントの集団を用いて,創発的プロトコルは基本構成構造を持つことを示す。
- 参考スコア(独自算出の注目度): 49.11609702016523
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emergent communication in artificial agents has been studied to understand
language evolution, as well as to develop artificial systems that learn to
communicate with humans. We show that agents performing a cooperative
navigation task in various gridworld environments learn an interpretable
communication protocol that enables them to efficiently, and in many cases,
optimally, solve the task. An analysis of the agents' policies reveals that
emergent signals spatially cluster the state space, with signals referring to
specific locations and spatial directions such as "left", "up", or "upper left
room". Using populations of agents, we show that the emergent protocol has
basic compositional structure, thus exhibiting a core property of natural
language.
- Abstract(参考訳): 人工エージェントにおける創発的コミュニケーションは、言語進化を理解するとともに、人間とのコミュニケーションを学ぶ人工システムを開発するために研究されている。
本稿では,様々なグリッドワールド環境において協調的なナビゲーションタスクを行うエージェントが,効率的な通信プロトコルを学習し,そのタスクを最適に解くことができることを示す。
エージェントのポリシーを分析すると、創発的な信号が状態空間を空間的にクラスタリングし、「左」、「上」、「上左室」のような特定の位置と空間方向を参照する信号が現れる。
エージェントの集団を用いて,創発プロトコルが基本構成構造を持ち,自然言語の中核的特性を示すことを示す。
関連論文リスト
- Bidirectional Emergent Language in Situated Environments [4.950411915351642]
マルチエージェントポンとコレクターの2つの新しい協調環境を紹介した。
最適なパフォーマンスには通信プロトコルの出現が必要ですが、適度な成功はそれなしで達成できます。
エージェントは意味のあるメッセージのみを生成し、調整なしでは成功できない状態の受信メッセージに作用する。
論文 参考訳(メタデータ) (2024-08-26T21:25:44Z) - Symbolic Learning Enables Self-Evolving Agents [55.625275970720374]
エージェントシンボリックラーニング(エージェントシンボリックラーニング)(エージェントシンボリックラーニング)は、言語エージェントが自分自身で最適化できるための体系的なフレームワークである。
エージェント記号学習は、コネクショナリズム学習における2つの基本的なアルゴリズムを模倣することにより、言語エージェント内のシンボルネットワークを最適化するように設計されている。
我々は、標準ベンチマークと複雑な実世界のタスクの両方で概念実証実験を行う。
論文 参考訳(メタデータ) (2024-06-26T17:59:18Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Cooperative Multi-Agent Learning for Navigation via Structured State
Abstraction [35.137788512033694]
本研究では,ナビゲーションタスクに参加するエージェント間の適応状態空間抽象化と通信プロトコルを学習するためのニューラルネットワークアーキテクチャを提案する。
目標は、政策性能を劣化させることなく、探索すべき状態空間のサイズを大幅に削減する適応的な抽象化器を考案することである。
論文 参考訳(メタデータ) (2023-06-20T07:06:17Z) - Learning to Ground Multi-Agent Communication with Autoencoders [43.22048280036316]
コミュニケーションには共通言語であるラングア・フランカがエージェント間で必要である。
学習した表現において、言語を基底とする簡単な方法を示す。
標準表現学習アルゴリズムは,共通言語に到達するのに十分であることがわかった。
論文 参考訳(メタデータ) (2021-10-28T17:57:26Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - Networked Multi-Agent Reinforcement Learning with Emergent Communication [18.47483427884452]
MARL(Multi-Agent Reinforcement Learning)法は,他の学習エージェントの存在下で活動するエージェントに対して最適なポリシーを求める。
コーディネートするひとつの方法は、相互通信を学ぶことです。
エージェントは共通のタスクを実行するために学習しながら言語を開発することができるか?
論文 参考訳(メタデータ) (2020-04-06T16:13:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。