論文の概要: Dynamic population-based meta-learning for multi-agent communication
with natural language
- arxiv url: http://arxiv.org/abs/2110.14241v1
- Date: Wed, 27 Oct 2021 07:50:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-28 12:31:22.028126
- Title: Dynamic population-based meta-learning for multi-agent communication
with natural language
- Title(参考訳): 自然言語によるマルチエージェントコミュニケーションのための動的集団ベースメタラーニング
- Authors: Abhinav Gupta, Marc Lanctot, Angeliki Lazaridou
- Abstract要約: 我々は、自然言語を含むマルチエージェント通信環境において、目に見えない、見えない、人間のパートナーと協調できるエージェントを訓練する。
本稿では,このような集団を反復的に構築する,動的な人口ベースメタラーニング手法を提案する。
私たちのエージェントは、見たパートナーや人間とのコミュニケーションにおいて、すべての先行作業より優れています。
- 参考スコア(独自算出の注目度): 44.87604064505434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, our goal is to train agents that can coordinate with seen,
unseen as well as human partners in a multi-agent communication environment
involving natural language. Previous work using a single set of agents has
shown great progress in generalizing to known partners, however it struggles
when coordinating with unfamiliar agents. To mitigate that, recent work
explored the use of population-based approaches, where multiple agents interact
with each other with the goal of learning more generic protocols. These
methods, while able to result in good coordination between unseen partners,
still only achieve so in cases of simple languages, thus failing to adapt to
human partners using natural language. We attribute this to the use of static
populations and instead propose a dynamic population-based meta-learning
approach that builds such a population in an iterative manner. We perform a
holistic evaluation of our method on two different referential games, and show
that our agents outperform all prior work when communicating with seen partners
and humans. Furthermore, we analyze the natural language generation skills of
our agents, where we find that our agents also outperform strong baselines.
Finally, we test the robustness of our agents when communicating with
out-of-population agents and carefully test the importance of each component of
our method through ablation studies.
- Abstract(参考訳): 本研究の目的は、自然言語を含むマルチエージェントコミュニケーション環境において、見慣れない人間パートナーと協調できるエージェントを訓練することである。
これまでの1組のエージェントを用いた作業は、既知のパートナーに一般化する上で大きな進歩を見せている。
これを軽減するために、近年の研究は、複数のエージェントが互いに相互作用し、より汎用的なプロトコルを学ぶという、人口ベースのアプローチの利用を探求した。
これらの手法は、目に見えないパートナー同士のコーディネーションを良くするが、単純な言語の場合のみ達成できるため、自然言語を使って人間のパートナーに適応できない。
我々はこれを静的集団の利用と位置づけ、その代わりに反復的に集団を構築する動的な集団ベースのメタラーニングアプローチを提案する。
我々は,2つの異なる参照ゲームにおいて,本手法の全体的評価を行い,見知らぬパートナーや人間とのコミュニケーションにおいて,エージェントがすべての先行作業より優れていることを示す。
さらに、エージェントの自然言語生成スキルを分析し、エージェントが強力なベースラインを上回ることも分かりました。
最後に, 集団外エージェントとのコミュニケーションにおいて, エージェントのロバスト性をテストし, アブレーション研究を通じて各成分の重要性を慎重に検証した。
関連論文リスト
- COMMA: A Communicative Multimodal Multi-Agent Benchmark [7.831385481814481]
本稿では,言語コミュニケーションによるマルチモーダルマルチエージェントシステムの協調性能を評価するための新しいベンチマークを提案する。
オープンソースモデルとクローズドソースモデルを用いてエージェントエージェントとエージェント-ヒューマンのコラボレーションをテストすることにより、最先端モデルにおける驚くほどの弱点が明らかとなった。
論文 参考訳(メタデータ) (2024-10-10T02:49:47Z) - Bidirectional Emergent Language in Situated Environments [4.950411915351642]
マルチエージェントポンとコレクターの2つの新しい協調環境を紹介した。
最適なパフォーマンスには通信プロトコルの出現が必要ですが、適度な成功はそれなしで達成できます。
エージェントは意味のあるメッセージのみを生成し、調整なしでは成功できない状態の受信メッセージに作用する。
論文 参考訳(メタデータ) (2024-08-26T21:25:44Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。
モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Enhancing Multi-Agent Coordination through Common Operating Picture
Integration [14.927199437011044]
各エージェントは、その観察、行動、メッセージの履歴を共通のオペレーティング・ピクチャー(COP)に組み込むことができる。
本研究は, COP統合の有効性を実証し, 従来のマルチエージェント強化学習(MARL)法と比較して, COPをベースとしたトレーニングが, アウト・オブ・ディストリビューション初期状態に直面した場合に, 堅牢なポリシーをもたらすことを示す。
論文 参考訳(メタデータ) (2023-11-08T15:08:55Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Toward Collaborative Reinforcement Learning Agents that Communicate
Through Text-Based Natural Language [4.289574109162585]
本稿では,テキストベースの自然言語を,強化学習で訓練されたエージェント間のコミュニケーションの新たな形態とみなす。
Blind Leadsのゲームに触発されて、あるエージェントが自然言語を使って迷路を案内する環境を提案する。
論文 参考訳(メタデータ) (2021-07-20T09:19:29Z) - Multi-agent Communication meets Natural Language: Synergies between
Functional and Structural Language Learning [16.776753238108036]
本稿では,マルチエージェント通信と従来のデータ駆動型アプローチを組み合わせた自然言語学習手法を提案する。
私たちの出発点は、タスク固有の言語データではなく、ジェネリックに基づいて訓練された言語モデルです。
次に、このモデルをマルチエージェントのセルフプレイ環境に配置し、モデルへの適応や修正に使用するタスク固有の報酬を生成する。
論文 参考訳(メタデータ) (2020-05-14T15:32:23Z) - Learning to cooperate: Emergent communication in multi-agent navigation [49.11609702016523]
本稿では,協調ナビゲーションタスクを行うエージェントが,解釈可能な通信プロトコルを学ぶことを示す。
エージェントのポリシーの分析により、創発的信号が状態空間を空間的にクラスタリングすることが明らかになった。
エージェントの集団を用いて,創発的プロトコルは基本構成構造を持つことを示す。
論文 参考訳(メタデータ) (2020-04-02T16:03:17Z) - On the interaction between supervision and self-play in emergent
communication [82.290338507106]
本研究は,2つのカテゴリの学習信号と,サンプル効率の向上を目標とする学習信号の関係について検討する。
人間のデータに基づく教師付き学習による初等訓練エージェントが,自己演奏が会話に優れていることが判明した。
論文 参考訳(メタデータ) (2020-02-04T02:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。