論文の概要: Learning to Infer Belief Embedded Communication
- arxiv url: http://arxiv.org/abs/2203.07832v1
- Date: Tue, 15 Mar 2022 12:42:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 15:07:54.277351
- Title: Learning to Infer Belief Embedded Communication
- Title(参考訳): 信念の組込みコミュニケーションを推論する学習
- Authors: Guo Ye and Han Liu and Biswa Sengupta
- Abstract要約: 本稿ではエージェントの言語学習能力を模倣する新しいアルゴリズムを提案する。
過去の行動に対応する他のエージェントの意図を復号するための知覚モジュールを含んでいる。
また、2つ以上のエージェントとの通信中に暗黙の文法を学ぶための言語生成モジュールも含まれている。
- 参考スコア(独自算出の注目度): 9.862909791015237
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In multi-agent collaboration problems with communication, an agent's ability
to encode their intention and interpret other agents' strategies is critical
for planning their future actions. This paper introduces a novel algorithm
called Intention Embedded Communication (IEC) to mimic an agent's language
learning ability. IEC contains a perception module for decoding other agents'
intentions in response to their past actions. It also includes a language
generation module for learning implicit grammar during communication with two
or more agents. Such grammar, by construction, should be compact for efficient
communication. Both modules undergo conjoint evolution - similar to an infant's
babbling that enables it to learn a language of choice by trial and error. We
utilised three multi-agent environments, namely predator/prey, traffic junction
and level-based foraging and illustrate that such a co-evolution enables us to
learn much quicker (50%) than state-of-the-art algorithms like MADDPG. Ablation
studies further show that disabling the inferring belief module, communication
module, and the hidden states reduces the model performance by 38%, 60% and
30%, respectively. Hence, we suggest that modelling other agents' behaviour
accelerates another agent to learn grammar and develop a language to
communicate efficiently. We evaluate our method on a set of cooperative
scenarios and show its superior performance to other multi-agent baselines. We
also demonstrate that it is essential for agents to reason about others' states
and learn this ability by continuous communication.
- Abstract(参考訳): コミュニケーションを伴うマルチエージェント協調問題において、エージェントの意図をエンコードし、他のエージェントの戦略を解釈する能力は、将来のアクションの計画に不可欠である。
本稿では,エージェントの言語学習能力を模倣する,IEC(Intention Embedded Communication)と呼ばれる新しいアルゴリズムを提案する。
IECには、過去の行動に対応する他のエージェントの意図を復号するための知覚モジュールが含まれている。
また、2つ以上のエージェントとのコミュニケーション中に暗黙の文法を学ぶための言語生成モジュールも含まれている。
このような文法は、構成上、効率的な通信のためにコンパクトでなければならない。
どちらのモジュールもコンジョイント進化 (conjoint evolution) - 試行錯誤によって選択した言語を学習できる幼児のバブリングに似ている。
我々は、捕食者/獲物、交通ジャンクション、レベルベースの採餌という3つのマルチエージェント環境を利用して、MADDPGのような最先端のアルゴリズムよりも、より速く(50%)学習できることを示す。
アブレーション研究により、推定信念モジュール、通信モジュール、隠蔽状態の無効化はモデル性能をそれぞれ38%、60%、30%減少させることが示された。
したがって、他のエージェントの振る舞いをモデル化することで、他のエージェントが文法を学習し、効率的にコミュニケーションする言語を開発することを提案する。
提案手法を協調シナリオの集合上で評価し,他のマルチエージェントベースラインよりも優れた性能を示す。
また、エージェントが他人の状態を判断し、継続的なコミュニケーションによってこの能力を学ぶことが不可欠であることを示す。
関連論文リスト
- Verco: Learning Coordinated Verbal Communication for Multi-agent Reinforcement Learning [42.27106057372819]
本稿では,大規模言語モデルをエージェントに組み込むマルチエージェント強化学習アルゴリズムを提案する。
フレームワークにはメッセージモジュールとアクションモジュールがある。
オーバークッキングゲームで行った実験は,既存の手法の学習効率と性能を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2024-04-27T05:10:33Z) - ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - Learning Emergent Discrete Message Communication for Cooperative
Reinforcement Learning [36.468498804251574]
離散メッセージ通信は連続メッセージ通信に匹敵する性能を有することを示す。
エージェントに離散的なメッセージを対話的に送信できるアプローチを提案します。
論文 参考訳(メタデータ) (2021-02-24T20:44:14Z) - The Emergence of Adversarial Communication in Multi-Agent Reinforcement
Learning [6.18778092044887]
多くの現実世界の問題は、複数の自律エージェントの調整を必要とする。
最近の研究は、複雑なマルチエージェント協調を可能にする明示的なコミュニケーション戦略を学ぶためのグラフニューラルネットワーク(GNN)の約束を示している。
一つの利己的なエージェントが高度に操作的なコミュニケーション戦略を学習し、協調的なエージェントチームを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-08-06T12:48:08Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z) - Networked Multi-Agent Reinforcement Learning with Emergent Communication [18.47483427884452]
MARL(Multi-Agent Reinforcement Learning)法は,他の学習エージェントの存在下で活動するエージェントに対して最適なポリシーを求める。
コーディネートするひとつの方法は、相互通信を学ぶことです。
エージェントは共通のタスクを実行するために学習しながら言語を開発することができるか?
論文 参考訳(メタデータ) (2020-04-06T16:13:23Z) - Emergence of Pragmatics from Referential Game between Theory of Mind
Agents [64.25696237463397]
エージェントが手書きのルールを指定せずに「行間を読む」能力を自発的に学習するアルゴリズムを提案する。
協調型マルチエージェント教育状況における心の理論(ToM)を統合し,適応型強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-21T19:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。