論文の概要: TEACh: Task-driven Embodied Agents that Chat
- arxiv url: http://arxiv.org/abs/2110.00534v1
- Date: Fri, 1 Oct 2021 17:00:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-04 16:22:57.363729
- Title: TEACh: Task-driven Embodied Agents that Chat
- Title(参考訳): TEACh: チャットするタスク駆動型体操エージェント
- Authors: Aishwarya Padmakumar, Jesse Thomason, Ayush Shrivastava, Patrick
Lange, Anjali Narayan-Chen, Spandana Gella, Robinson Piramithu, Gokhan Tur,
Dilek Hakkani-Tur
- Abstract要約: シミュレーションにおいて,3千人以上の人間-人間-対話的対話のデータセットであるTEAChを紹介した。
タスクに関するオラクル情報にアクセスするコマンドは、自然言語でFollowerと通信する。
本稿では,TEAChを用いた3つのベンチマークを提案し,具体的インテリジェンス課題について検討する。
- 参考スコア(独自算出の注目度): 14.142543383443032
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Robots operating in human spaces must be able to engage in natural language
interaction with people, both understanding and executing instructions, and
using conversation to resolve ambiguity and recover from mistakes. To study
this, we introduce TEACh, a dataset of over 3,000 human--human, interactive
dialogues to complete household tasks in simulation. A Commander with access to
oracle information about a task communicates in natural language with a
Follower. The Follower navigates through and interacts with the environment to
complete tasks varying in complexity from "Make Coffee" to "Prepare Breakfast",
asking questions and getting additional information from the Commander. We
propose three benchmarks using TEACh to study embodied intelligence challenges,
and we evaluate initial models' abilities in dialogue understanding, language
grounding, and task execution.
- Abstract(参考訳): 人間の空間で動くロボットは、人間との自然言語の対話、指示の理解と実行、あいまいさの解消と失敗からの回復のために会話を利用する必要がある。
そこで本研究では,3000人以上の人間-人間-対話的対話のデータセットであるTEAChを紹介する。
タスクに関するoracleの情報にアクセスするコマンダーは、自然言語でフォロワと通信する。
フォロワは、"make coffee"から"prepare breakfast"まで、複雑性の異なるタスクを完了するために環境をナビゲートし、対話します。
TEAChを用いた3つのベンチマークを行い,対話理解,言語基盤,タスク実行における初期モデルの能力を評価する。
関連論文リスト
- tagE: Enabling an Embodied Agent to Understand Human Instructions [3.943519623674811]
我々は, Embodied Agent (tagE) のためのタスク・アンド・引数・グラウンドティング(タスク・アンド・引数・グラウンドディング)と呼ばれる新しいシステムを導入する。
本システムでは,自然言語で表現された複雑なタスク命令から一連のタスクを抽出するために,発明的なニューラルネットワークモデルを採用している。
提案モデルでは,入れ子デコードに富んだエンコーダ・デコーダ・フレームワークを用いて,複雑な命令からタスクとその引数を効果的に抽出する。
論文 参考訳(メタデータ) (2023-10-24T08:17:48Z) - Dobby: A Conversational Service Robot Driven by GPT-4 [22.701223191699412]
この研究は、対話型AIエージェントをサービスタスクの具体化システムに組み込むロボティクスプラットフォームを導入する。
このエージェントは、膨大な一般知識のコーパスから学んだ、大きな言語モデルに由来する。
本発明のエージェントは対話生成に加えて、ロボットのコマンドを呼び出し、物理世界と対話することができる。
論文 参考訳(メタデータ) (2023-10-10T04:34:00Z) - Interactive Conversational Head Generation [68.76774230274076]
対面会話における1つのインターロケータの振る舞いを合成するための新しい対話ヘッド生成ベンチマークを提案する。
長時間・複数回会話に参加可能なインターロカクタを自動的に合成する機能は不可欠であり、様々なアプリケーションにメリットを提供する。
論文 参考訳(メタデータ) (2023-07-05T08:06:26Z) - Collecting Interactive Multi-modal Datasets for Grounded Language
Understanding [66.30648042100123]
自然言語タスクを用いた協調型エンボディエージェントの定式化を行った。
広範かつスケーラブルなデータ収集ツールを開発しました。
対話型基底言語理解のための最初のデータセットを収集した。
論文 参考訳(メタデータ) (2022-11-12T02:36:32Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Interactive Grounded Language Understanding in a Collaborative
Environment: IGLU 2021 [58.196738777207315]
協調環境における対話型接地言語理解のためのemphIGLUを提案する。
競争の主目的は、対話型エージェントをいかにして構築するかという問題にアプローチすることであり、協調環境において、接地された自然言語命令を提供しながらタスクの解決を学ぶことである。
論文 参考訳(メタデータ) (2022-05-05T01:20:09Z) - Training Conversational Agents with Generative Conversational Networks [74.9941330874663]
我々は、生成会話ネットワークを使用して、自動的にデータを生成し、社会的会話エージェントを訓練する。
自動メトリクスと人的評価器を用いてTopicalChatのアプローチを評価し、10%のシードデータで100%のデータを使用するベースラインに近いパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-10-15T21:46:39Z) - How Should Agents Ask Questions For Situated Learning? An Annotated
Dialogue Corpus [13.12257465328948]
本稿では,HuRDLコーパス(HuRDL: Human-Robot Dialogue Learning)について紹介する。
コーパスデータとそれに対応するアノテーションスキームを記述し、人間が現在位置する環境での学習を促進するために求める質問の形式と内容について考察する。
論文 参考訳(メタデータ) (2021-06-11T16:58:22Z) - Situated Language Learning via Interactive Narratives [16.67845396797253]
本稿では,文脈的関連のある自然言語を理解し,生成する能力を持つ学習エージェントの活用方法について考察する。
このようなエージェントを作成するための2つの重要なコンポーネントは、相互作用と環境接地です。
テキストゲームのパズルのような構造と自然言語状態とアクション空間が組み合わさったユニークな課題について論じる。
論文 参考訳(メタデータ) (2021-03-18T01:55:16Z) - TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented
Dialogue [113.45485470103762]
本研究では,言語モデリングのためのタスク指向対話データセットを,人間とマルチターンの9つに統合する。
事前学習時の対話動作をモデル化するために,ユーザトークンとシステムトークンをマスク付き言語モデルに組み込む。
論文 参考訳(メタデータ) (2020-04-15T04:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。