論文の概要: Few-shot Language Coordination by Modeling Theory of Mind
- arxiv url: http://arxiv.org/abs/2107.05697v1
- Date: Mon, 12 Jul 2021 19:26:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-15 02:50:38.956172
- Title: Few-shot Language Coordination by Modeling Theory of Mind
- Title(参考訳): 心のモデリング理論によるマイトショット言語協調
- Authors: Hao Zhu, Graham Neubig, Yonatan Bisk
- Abstract要約: 我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
- 参考スコア(独自算出の注目度): 95.54446989205117
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: $\textit{No man is an island.}$ Humans communicate with a large community by
coordinating with different interlocutors within short conversations. This
ability has been understudied by the research on building neural communicative
agents. We study the task of few-shot $\textit{language coordination}$: agents
quickly adapting to their conversational partners' language abilities.
Different from current communicative agents trained with self-play, we require
the lead agent to coordinate with a $\textit{population}$ of agents with
different linguistic abilities, quickly adapting to communicate with unseen
agents in the population. This requires the ability to model the partner's
beliefs, a vital component of human communication. Drawing inspiration from
theory-of-mind (ToM; Premack& Woodruff (1978)), we study the effect of the
speaker explicitly modeling the listeners' mental states. The speakers, as
shown in our experiments, acquire the ability to predict the reactions of their
partner, which helps it generate instructions that concisely express its
communicative goal. We examine our hypothesis that the instructions generated
with ToM modeling yield better communication performance in both a referential
game and a language navigation task. Positive results from our experiments hint
at the importance of explicitly modeling communication as a socio-pragmatic
progress.
- Abstract(参考訳): $\textit{No man is a island.
短い会話の中で異なる対話者と協調することで、人間は大きなコミュニティとコミュニケーションを取ります。
この能力は神経伝達物質の構築の研究によって研究されている。
We study the task of few-shot $\textit{lang coordinate}$: agent adapting with their conversational partners' language abilities。
セルフプレイで訓練された現在のコミュニケーションエージェントと異なり、私たちはリードエージェントに、異なる言語能力を持つエージェントの$\textit{population}$を調整させ、素早く人口の見えないエージェントとのコミュニケーションに適応するよう要求します。
これは、人間のコミュニケーションの重要な要素であるパートナーの信念をモデル化する能力を必要とする。
理論オブマインドド(tom; premack & woodruff, 1978)から着想を得て,聞き手の精神状態を明示的にモデル化した話者の効果について検討した。
実験で示したように、スピーカーはパートナーの反応を予測する能力を獲得し、そのコミュニケーション目標を簡潔に表現する指示を生成するのに役立ちます。
我々は,tomモデリングによって生成された命令が,参照ゲームと言語ナビゲーションタスクの両方においてより良いコミュニケーション性能をもたらすという仮説を検証した。
実験のポジティブな結果から,コミュニケーションを社会プラグマティックな進歩として明示的にモデル化することの重要性が示唆された。
関連論文リスト
- Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Computational Language Acquisition with Theory of Mind [84.2267302901888]
我々は、心の理論(ToM)を備えた言語学習エージェントを構築し、その学習過程への影響を測定する。
重み付けされたToMリスナーコンポーネントを用いた学習話者は,画像参照ゲームの設定において,性能向上につながることがわかった。
論文 参考訳(メタデータ) (2023-03-02T18:59:46Z) - Communication Drives the Emergence of Language Universals in Neural
Agents: Evidence from the Word-order/Case-marking Trade-off [3.631024220680066]
ニューラルエージェント言語学習通信フレームワーク(NeLLCom)を提案する。
我々はエージェントに特定のバイアスをハードコーディングすることなく、新しいフレームワークでトレードオフを複製することに成功しました。
論文 参考訳(メタデータ) (2023-01-30T17:22:33Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Self-play for Data Efficient Language Acquisition [20.86261546611472]
学習エージェントにおける言語習得の効率と品質を向上させるために,コミュニケーションの対称性を利用する。
直接監督の代わりにセルフプレイを使用することで、エージェントが役割間で知識を伝達できることが示される。
論文 参考訳(メタデータ) (2020-10-10T02:09:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。