論文の概要: Inferring the Goals of Communicating Agents from Actions and
Instructions
- arxiv url: http://arxiv.org/abs/2306.16207v1
- Date: Wed, 28 Jun 2023 13:43:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-29 14:08:05.924437
- Title: Inferring the Goals of Communicating Agents from Actions and
Instructions
- Title(参考訳): 行動や指示からエージェントを伝達する目標を推測する
- Authors: Lance Ying, Tan Zhi-Xuan, Vikash Mansinghka, Joshua B. Tenenbaum
- Abstract要約: 本稿では,あるエージェント,プリンシパルが,その共有計画に関する自然言語指示を他のエージェント,アシスタントに伝達できるような協力チームのモデルを提案する。
3人目のオブザーバが、アクションや指示からマルチモーダルな逆計画を通じて、チームの目標を推測する方法を示します。
我々は,マルチエージェントグリッドワールドにおける人間の目標推定と比較し,モデルの推定が人間の判断と密接に相関していることを見出した。
- 参考スコア(独自算出の注目度): 47.5816320484482
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When humans cooperate, they frequently coordinate their activity through both
verbal communication and non-verbal actions, using this information to infer a
shared goal and plan. How can we model this inferential ability? In this paper,
we introduce a model of a cooperative team where one agent, the principal, may
communicate natural language instructions about their shared plan to another
agent, the assistant, using GPT-3 as a likelihood function for instruction
utterances. We then show how a third person observer can infer the team's goal
via multi-modal Bayesian inverse planning from actions and instructions,
computing the posterior distribution over goals under the assumption that
agents will act and communicate rationally to achieve them. We evaluate this
approach by comparing it with human goal inferences in a multi-agent gridworld,
finding that our model's inferences closely correlate with human judgments (R =
0.96). When compared to inference from actions alone, we also find that
instructions lead to more rapid and less uncertain goal inference, highlighting
the importance of verbal communication for cooperative agents.
- Abstract(参考訳): 人間が協力すると、彼らはしばしば言語コミュニケーションと非言語行動の両方を通して活動の協調を行い、この情報を使って共通の目標と計画を立てる。
この推論能力をどのようにモデル化するか?
本稿では,一つのエージェントであるプリンシパルが,共有計画に関する自然言語指示を他のエージェントであるアシスタントに伝え,gpt-3を指導発話の確率関数として用いる協調チームのモデルを提案する。
次に、第三者のオブザーバが行動や指示からマルチモーダルベイズ逆計画を通じてチームのゴールを推測し、エージェントが行動し、合理的にコミュニケーションして達成することを前提として、目標に対する後方分布を計算する方法を示す。
提案手法は,マルチエージェントグリッドワールドにおける人間の目標推定と比較し,モデルの推定が人間の判断と密接に相関していること(R = 0.96)を見出した。
また,行動のみからの推論と比較すると,指示がより迅速かつ不確定な目標推論につながり,協調エージェントにとっての言語コミュニケーションの重要性が強調された。
関連論文リスト
- Pragmatic Instruction Following and Goal Assistance via Cooperative
Language-Guided Inverse Planning [52.91457780361305]
本稿では,協調型言語誘導逆計画探索(CLIPS)を紹介する。
我々のエージェントは、協力的なプランナーとして人間をモデル化し、アシスタントに共同計画を伝える。
2つの協調計画領域(ドア,キー&ジェム,バーチャルホーム)におけるこれらの機能の評価
論文 参考訳(メタデータ) (2024-02-27T23:06:53Z) - Control as Probabilistic Inference as an Emergent Communication
Mechanism in Multi-Agent Reinforcement Learning [7.0471949371778795]
本稿では,創発的コミュニケーションと強化学習を統合した生成確率モデルを提案する。
提案したPGMは協調作業を実現するために有意義なメッセージを推測できることを示す。
論文 参考訳(メタデータ) (2023-07-11T03:53:46Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - ToM2C: Target-oriented Multi-agent Communication and Cooperation with
Theory of Mind [18.85252946546942]
心の理論(Theory of Mind、ToM)は、効果的なコミュニケーションと協力が可能な社会的に知的なエージェントを構築する。
このアイデアは、協調ナビゲーションとマルチセンサーターゲットカバレッジという、2つの典型的な目標指向型マルチエージェントタスクで実証される。
論文 参考訳(メタデータ) (2021-10-15T18:29:55Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - The Emergence of Adversarial Communication in Multi-Agent Reinforcement
Learning [6.18778092044887]
多くの現実世界の問題は、複数の自律エージェントの調整を必要とする。
最近の研究は、複雑なマルチエージェント協調を可能にする明示的なコミュニケーション戦略を学ぶためのグラフニューラルネットワーク(GNN)の約束を示している。
一つの利己的なエージェントが高度に操作的なコミュニケーション戦略を学習し、協調的なエージェントチームを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-08-06T12:48:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。