論文の概要: UBAR: Towards Fully End-to-End Task-Oriented Dialog Systems with GPT-2
- arxiv url: http://arxiv.org/abs/2012.03539v2
- Date: Thu, 18 Mar 2021 02:34:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:31:08.788090
- Title: UBAR: Towards Fully End-to-End Task-Oriented Dialog Systems with GPT-2
- Title(参考訳): UBAR: GPT-2によるタスク指向対話システムの実現に向けて
- Authors: Yunyi Yang, Yunhao Li, Xiaojun Quan
- Abstract要約: UBARは、対話セッション全体のシーケンスで、訓練済みの大きな一方向言語モデルGPT-2を微調整することによって取得される。
UBARは、複数の設定で最先端のパフォーマンスを達成し、レスポンス生成、ポリシー最適化、エンドツーエンドモデリングをそれぞれ4.7、3.5、9.4ポイント改善した。
- 参考スコア(独自算出の注目度): 10.994360742583261
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents our task-oriented dialog system UBAR which models
task-oriented dialogs on a dialog session level. Specifically, UBAR is acquired
by fine-tuning the large pre-trained unidirectional language model GPT-2 on the
sequence of the entire dialog session which is composed of user utterance,
belief state, database result, system act, and system response of every dialog
turn. Additionally, UBAR is evaluated in a more realistic setting, where its
dialog context has access to user utterances and all content it generated such
as belief states, system acts, and system responses. Experimental results on
the MultiWOZ datasets show that UBAR achieves state-of-the-art performances in
multiple settings, improving the combined score of response generation, policy
optimization, and end-to-end modeling by 4.7, 3.5, and 9.4 points respectively.
Thorough analyses demonstrate that the session-level training sequence
formulation and the generated dialog context are essential for UBAR to operate
as a fully end-to-end task-oriented dialog system in real life. We also examine
the transfer ability of UBAR to new domains with limited data and provide
visualization and a case study to illustrate the advantages of UBAR in modeling
on a dialog session level.
- Abstract(参考訳): 本稿では,タスク指向ダイアログを対話セッションレベルでモデル化するタスク指向ダイアログシステムubarを提案する。
具体的には、ユーザ発話、信念状態、データベース結果、システム動作、各ダイアログターンのシステム応答からなるダイアログセッション全体のシーケンスに基づいて、大きな事前訓練された一方向言語モデルGPT-2を微調整することによりUBARを取得する。
さらに、ubarはより現実的な設定で評価され、そのダイアログコンテキストはユーザの発話と、信念状態、システム行動、システム応答といったすべてのコンテンツにアクセスできる。
MultiWOZデータセットによる実験結果から,UBARは複数の設定で最先端のパフォーマンスを実現し,応答生成,ポリシー最適化,エンドツーエンドモデリングの合計スコアをそれぞれ4.7,3.5,9.4ポイント向上した。
より詳細な分析により,セッションレベルのトレーニングシーケンスの定式化と生成したダイアログコンテキストが,実生活における完全なエンドツーエンドのタスク指向ダイアログシステムとして機能することの重要性が示された。
また、UBARの限られたデータを持つ新しいドメインへの転送能力について検討し、対話セッションレベルでのモデリングにおけるUBARの利点を説明するための可視化とケーススタディを提供する。
関連論文リスト
- VDialogUE: A Unified Evaluation Benchmark for Visually-grounded Dialogue [70.64560638766018]
textbfUnified textbfEvaluation のためのtextbfVisually-grounded textbfDialogue ベンチマークである textbfVDialogUE を提案する。
5つのコアマルチモーダル対話タスクを定義し、6つのデータセットをカバーする。
また,textbfVISIT(textbfVISually-grounded dtextbfIalog textbfTransformer)という,単純で効率的なベースラインモデルも提示し,その進歩を促進させる。
論文 参考訳(メタデータ) (2023-09-14T02:09:20Z) - FCC: Fusing Conversation History and Candidate Provenance for Contextual
Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。
会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-31T23:58:28Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - Dialog Acts for Task-Driven Embodied Agents [10.275619475149433]
エージェントは自然言語の理解タスク記述で対話し、適切なフォローアップ質問をすることができる必要がある。
このような対話をモデル化するためのダイアログのセットを提案し、3000以上のタスク指向の会話を含むTEAChデータセットに注釈を付ける。
この注釈付きデータセットを、与えられた発話のダイアログ動作にタグ付けし、ダイアログ履歴を与えられた次の応答のダイアログ動作を予測する訓練モデルに使用し、ダイアログ動作を使用してエージェントの非ダイアログ動作をガイドする。
論文 参考訳(メタデータ) (2022-09-26T18:41:28Z) - SPACE-3: Unified Dialog Model Pre-training for Task-Oriented Dialog
Understanding and Generation [123.37377363355363]
SPACE-3は、大規模対話コーパスから学習する、新しい半教師付き会話モデルである。
幅広いダウンストリームダイアログタスクを効果的に微調整できる。
その結果、SPACE-3は8つの下流ダイアログベンチマークで最先端のパフォーマンスを達成することがわかった。
論文 参考訳(メタデータ) (2022-09-14T14:17:57Z) - SPACE-2: Tree-Structured Semi-Supervised Contrastive Pre-training for
Task-Oriented Dialog Understanding [68.94808536012371]
本稿では,限定ラベル付きダイアログと大規模未ラベルダイアログコーパスから対話表現を学習する,木構造付き事前学習会話モデルを提案する。
提案手法は,7つのデータセットと4つの一般的な対話理解タスクからなるDialoGLUEベンチマークにおいて,最新の結果が得られる。
論文 参考訳(メタデータ) (2022-09-14T13:42:50Z) - Interactive Evaluation of Dialog Track at DSTC9 [8.2208199207543]
第9回ダイアログ・システム・テクノロジー・チャレンジで対話的ダイアログ・トラックの評価が導入された。
本稿では,方法論と結果を含むトラックの概要について述べる。
論文 参考訳(メタデータ) (2022-07-28T22:54:04Z) - GALAXY: A Generative Pre-trained Model for Task-Oriented Dialog with
Semi-Supervised Learning and Explicit Policy Injection [36.77204909711832]
本稿では,限定ラベル付きダイアログと大規模未ラベルダイアログコーパスから,対話ポリシーを明示的に学習する,事前学習型ダイアログモデルを提案する。
具体的には、事前学習中にポリシー最適化のためのダイアログアクト予測タスクを導入し、一貫性の規則化項を用いて、学習した表現を洗練させる。
その結果,GALAXYはタスク指向対話システムの性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2021-11-29T15:24:36Z) - Overview of the Ninth Dialog System Technology Challenge: DSTC9 [111.35889309106359]
第9回対話システム技術チャレンジ(DSTC-9)は、対話システムにおける4つの異なるタスクにエンドツーエンドの対話技術を適用することに焦点を当てている。
本稿では,各トラックのタスク定義,データセット,ベースライン,評価設定について述べる。
論文 参考訳(メタデータ) (2020-11-12T16:43:10Z) - SUMBT+LaRL: Effective Multi-domain End-to-end Neural Task-oriented
Dialog System [6.73550057218157]
実効的なマルチドメインエンドツーエンドトレーニング型ニューラルダイアログシステム SUMBT+LaRL を提案する。
具体的には、SUMBT+はユーザー行動とダイアログの信念状態を推定し、LaRLは潜在システム行動空間をモデル化し、応答を生成する。
本モデルでは,コーパスによる評価では85.4%,シミュレータによる評価では81.40%の新たな成功率を達成した。
論文 参考訳(メタデータ) (2020-09-22T11:02:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。