論文の概要: Dialog without Dialog Data: Learning Visual Dialog Agents from VQA Data
- arxiv url: http://arxiv.org/abs/2007.12750v1
- Date: Fri, 24 Jul 2020 19:35:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 05:46:38.450876
- Title: Dialog without Dialog Data: Learning Visual Dialog Agents from VQA Data
- Title(参考訳): 対話データのないダイアログ:vqaデータからビジュアルダイアログエージェントを学ぶ
- Authors: Michael Cogswell, Jiasen Lu, Rishabh Jain, Stefan Lee, Devi Parikh,
Dhruv Batra
- Abstract要約: 『ダイアログなしダイアログ』ではエージェントが言語レベルの監督なしに新しいタスクに適応できるダイアログモデルを開発する必要がある。
意図と言語を分解することにより、新しいタスクを微調整した後の言語的ドリフトを最小限に抑える。
- 参考スコア(独自算出の注目度): 75.7372052716556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Can we develop visually grounded dialog agents that can efficiently adapt to
new tasks without forgetting how to talk to people? Such agents could leverage
a larger variety of existing data to generalize to new tasks, minimizing
expensive data collection and annotation. In this work, we study a setting we
call "Dialog without Dialog", which requires agents to develop visually
grounded dialog models that can adapt to new tasks without language level
supervision. By factorizing intention and language, our model minimizes
linguistic drift after fine-tuning for new tasks. We present qualitative
results, automated metrics, and human studies that all show our model can adapt
to new tasks and maintain language quality. Baselines either fail to perform
well at new tasks or experience language drift, becoming unintelligible to
humans. Code has been made available at
https://github.com/mcogswell/dialog_without_dialog
- Abstract(参考訳): 人との会話を忘れずに、新しいタスクに効率的に適応できる対話エージェントを開発できるだろうか?
このようなエージェントは、さまざまな既存のデータを活用して新しいタスクに一般化し、高価なデータ収集とアノテーションを最小限にすることができる。
本研究では、エージェントが言語レベルでの監督なしに新しいタスクに適応できる視覚的な接地ダイアログモデルを開発することを要求する「ダイアログなしダイアログ」という設定について検討する。
意図と言語を因子づけすることで,新しいタスクの微調整後の言語ドリフトを最小限に抑える。
我々のモデルが新しいタスクに適応し、言語品質を維持することができることを示す定性的な結果、自動メトリクス、そして人間の研究を提示します。
ベースラインは新しいタスクでうまく機能しないか、言語ドリフトを経験しないかのどちらかで、人間には知性に欠ける。
コードはhttps://github.com/mcogswell/dialog_without_dialogで利用可能になった。
関連論文リスト
- Weakly Supervised Data Augmentation Through Prompting for Dialogue
Understanding [103.94325597273316]
本稿では,弱教師付きフィルタを適用して拡張品質を反復する手法を提案する。
我々は、デイリーダイアログにおける感情と行動の分類タスクと、Facebook Multilingual Task-Oriented Dialogueにおける意図の分類タスクについて評価した。
特にDailyDialogでは、真理データの10%を使用して、100%のデータを使用する現在の最先端モデルよりも優れています。
論文 参考訳(メタデータ) (2022-10-25T17:01:30Z) - Prompting for a conversation: How to control a dialog model? [9.268682116424518]
ダイアログモデルは大量のテキストでトレーニングされるが、その応答はダイアログエージェントの望ましいスコープとスタイルに制限される必要がある。
前者を達成するために使用されるデータセットには後者と互換性のない言語が含まれているため、事前訓練されたダイアログモデルは、より小さなキュレートされたデータセットで微調整される。
本稿では,上記のトレードオフを緩和できるかどうかを検討する。
論文 参考訳(メタデータ) (2022-09-22T14:59:55Z) - Adapting Task-Oriented Dialogue Models for Email Conversations [4.45709593827781]
本稿では,対話モデルの最新開発を長文会話に適用できる効果的な伝達学習フレームワーク(EMToD)を提案する。
提案するEMToDフレームワークは,事前学習した言語モデルに対する意図検出性能を45%向上し,タスク指向の電子メール会話において,事前学習した対話モデルに対する意図検出性能を30%向上することを示す。
論文 参考訳(メタデータ) (2022-08-19T16:41:34Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Modeling Coreference Relations in Visual Dialog [18.926582410644375]
ダイアログにおけるコア参照関係の発生は、視覚的質問応答よりも難しい課題となる。
教師なしの方法でダイアログにおけるコア参照を解消するモデルの能力を改善する2つのソフト制約を提案する。
論文 参考訳(メタデータ) (2022-03-06T15:22:24Z) - The Adapter-Bot: All-In-One Controllable Conversational Model [66.48164003532484]
本稿では、DialGPTなどの固定バックボーンモデルを用いて、異なるアダプタを介してオンデマンド対話スキルをトリガーする対話モデルを提案する。
スキルに応じて、モデルはテキスト、テーブル、強調応答などの複数の知識タイプを処理できる。
我々は,既存の会話モデルと比較し,自動評価を用いたモデルの評価を行った。
論文 参考訳(メタデータ) (2020-08-28T10:59:31Z) - SOLOIST: Building Task Bots at Scale with Transfer Learning and Machine
Teaching [81.45928589522032]
トランスフォーマーに基づく自動回帰言語モデルを用いて,モジュール型タスク指向対話システムをパラメータ化する。
タスクグラウンド応答生成モデルである異種ダイアログコーパスの事前学習を行う。
実験により、SOLOISTは、よく研究されたタスク指向のダイアログベンチマーク上で、新しい最先端のダイアログを生成する。
論文 参考訳(メタデータ) (2020-05-11T17:58:34Z) - TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented
Dialogue [113.45485470103762]
本研究では,言語モデリングのためのタスク指向対話データセットを,人間とマルチターンの9つに統合する。
事前学習時の対話動作をモデル化するために,ユーザトークンとシステムトークンをマスク付き言語モデルに組み込む。
論文 参考訳(メタデータ) (2020-04-15T04:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。