論文の概要: Zero-Shot Generalizable End-to-End Task-Oriented Dialog System using
Context Summarization and Domain Schema
- arxiv url: http://arxiv.org/abs/2303.16252v1
- Date: Tue, 28 Mar 2023 18:56:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-30 17:00:53.734103
- Title: Zero-Shot Generalizable End-to-End Task-Oriented Dialog System using
Context Summarization and Domain Schema
- Title(参考訳): コンテキスト要約とドメインスキーマを用いたゼロショット一般化型タスク指向対話システム
- Authors: Adib Mosharrof, M.H. Maqbool, A.B. Siddique
- Abstract要約: タスク指向対話システムにおける最先端のアプローチは、条件付きシーケンス生成タスクとして問題を定式化する。
これは、新しいドメインまたはタスクごとにラベル付きトレーニングデータを必要とする。
本稿では,ZS-ToDという,Zero-Shotの汎用的なエンドツーエンドタスク指向ダイアログシステムについて紹介する。
- 参考スコア(独自算出の注目度): 2.7178968279054936
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Task-oriented dialog systems empower users to accomplish their goals by
facilitating intuitive and expressive natural language interactions.
State-of-the-art approaches in task-oriented dialog systems formulate the
problem as a conditional sequence generation task and fine-tune pre-trained
causal language models in the supervised setting. This requires labeled
training data for each new domain or task, and acquiring such data is
prohibitively laborious and expensive, thus making it a bottleneck for scaling
systems to a wide range of domains. To overcome this challenge, we introduce a
novel Zero-Shot generalizable end-to-end Task-oriented Dialog system, ZS-ToD,
that leverages domain schemas to allow for robust generalization to unseen
domains and exploits effective summarization of the dialog history. We employ
GPT-2 as a backbone model and introduce a two-step training process where the
goal of the first step is to learn the general structure of the dialog data and
the second step optimizes the response generation as well as intermediate
outputs, such as dialog state and system actions. As opposed to
state-of-the-art systems that are trained to fulfill certain intents in the
given domains and memorize task-specific conversational patterns, ZS-ToD learns
generic task-completion skills by comprehending domain semantics via domain
schemas and generalizing to unseen domains seamlessly. We conduct an extensive
experimental evaluation on SGD and SGD-X datasets that span up to 20 unique
domains and ZS-ToD outperforms state-of-the-art systems on key metrics, with an
improvement of +17% on joint goal accuracy and +5 on inform. Additionally, we
present a detailed ablation study to demonstrate the effectiveness of the
proposed components and training mechanism
- Abstract(参考訳): タスク指向ダイアログシステムは、直感的で表現力のある自然言語インタラクションを促進することによって、ユーザが目標を達成することを可能にする。
タスク指向対話システムにおける最先端のアプローチは、条件付きシーケンス生成タスクと教師付き設定における微調整済み因果言語モデルとして問題を定式化する。
これは、新しいドメインやタスクごとにラベル付きトレーニングデータを必要とするため、そのようなデータを取得するのは、極めて困難でコストがかかるため、システムを幅広いドメインにスケーリングする上でボトルネックとなる。
この課題を克服するために、ドメインスキーマを活用して、未確認領域への堅牢な一般化を可能にし、ダイアログ履歴を効果的に要約するZES-ToDを提案する。
GPT-2をバックボーンモデルとし、第1ステップの目標はダイアログデータの一般的な構造を学習することであり、第2ステップはダイアログ状態やシステム動作などの中間出力だけでなく、応答生成を最適化する2段階のトレーニングプロセスを導入する。
与えられたドメイン内の特定の意図を満たし、タスク固有の会話パターンを記憶するように訓練された最先端のシステムとは対照的に、ZS-ToDはドメインスキーマを介してドメインセマンティクスを解釈し、目に見えないドメインにシームレスに一般化することで、汎用的なタスク補完スキルを学ぶ。
sgd と sgd-x データセットについて,最大 20 個の固有ドメインと zs-tod が主要メトリクスの最先端システムよりも優れており,共同目標精度が +17%,インフォメーションが +5 で改善されている。
さらに,提案するコンポーネントの有効性とトレーニングメカニズムについて,詳細なアブレーション研究を行った。
関連論文リスト
- Unified Language-driven Zero-shot Domain Adaptation [55.64088594551629]
Unified Language-driven Zero-shot Domain Adaptation (ULDA)は、新しいタスクセットである。
これにより、ドメインIDの知識を明示することなく、単一のモデルを多様なターゲットドメインに適応させることができる。
論文 参考訳(メタデータ) (2024-04-10T16:44:11Z) - PoE: a Panel of Experts for Generalized Automatic Dialogue Assessment [58.46761798403072]
モデルベース自動対話評価基準(ADEM)は,複数の領域にわたって良好に機能することが期待される。
大きな進歩にもかかわらず、ある領域でうまく機能するADEMは必ずしも他の領域に一般化するとは限らない。
本稿では,共有トランスフォーマーエンコーダと軽量アダプタの集合からなるPanel of Experts (PoE)ネットワークを提案する。
論文 参考訳(メタデータ) (2022-12-18T02:26:50Z) - A Simple But Effective Approach to n-shot Task-Oriented Dialogue
Augmentation [32.43362825854633]
本稿では,タスク指向対話を完全自動で生成するフレームワークを提案する。
我々のフレームワークはタスク指向対話における各ターンペアは特定の機能を持つという単純な考え方を用いています。
いくつかのドメインの微調整シナリオの大幅な改善を観察します。
論文 参考訳(メタデータ) (2021-02-27T18:55:12Z) - A Hybrid Task-Oriented Dialog System with Domain and Task Adaptive
Pretraining [25.674966922466467]
本稿では,第9回ダイアログ・システム・テクノロジー・チャレンジ(DSTC-9)におけるエンド・ツー・エンドマルチドメインタスク・コンプリート・ダイアログ共有タスクについて述べる。
共有タスクの参加者は、人的評価とユーザシミュレータによる自動評価により評価されるエンドツーエンドのタスク完了ダイアログシステムを構築する。
論文 参考訳(メタデータ) (2021-02-08T20:02:30Z) - RADDLE: An Evaluation Benchmark and Analysis Platform for Robust
Task-oriented Dialog Systems [75.87418236410296]
我々はraddleベンチマーク、コーパスのコレクション、および様々なドメインのモデルのパフォーマンスを評価するためのツールを紹介します。
RADDLEは強力な一般化能力を持つモデルを好んで奨励するように設計されている。
先行学習と微調整に基づく最近の最先端システムの評価を行い,異種ダイアログコーパスに基づく基礎的な事前学習が,ドメインごとの個別モデルをトレーニングするよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-12-29T08:58:49Z) - Point or Generate Dialogue State Tracker [0.0]
我々はPOGD(Point-Or-Generate Dialogue State Tracker)を提案する。
POGDは、ユーザの発話から明示的に表現されたスロット値を指摘し、スロット固有のコンテキストに基づいて暗黙的に表現されたスロットを生成する。
実験によると、POGDはWoZ 2.0とMultiWoZ 2.0の両方のデータセットで最先端の結果を得るだけでなく、目に見えない値と新しいスロットをうまく一般化している。
論文 参考訳(メタデータ) (2020-08-08T02:15:25Z) - UniConv: A Unified Conversational Neural Architecture for Multi-domain
Task-oriented Dialogues [101.96097419995556]
ユニコンブ」はタスク指向対話におけるエンドツーエンド対話システムのための新しい統合型ニューラルネットワークである。
我々は、MultiWOZ2.1ベンチマークにおいて、対話状態追跡、コンテキスト・ツー・テキスト、エンドツーエンド設定の包括的な実験を行う。
論文 参考訳(メタデータ) (2020-04-29T16:28:22Z) - Recent Advances and Challenges in Task-oriented Dialog System [63.82055978899631]
課題指向対話システムは、学術・産業社会でますます注目を集めている。
タスク指向ダイアログシステムにおける3つの重要なトピックについて論じる。(1)低リソース環境でのダイアログモデリングを容易にするデータ効率の改善、(2)ダイアログポリシー学習のためのマルチターンダイナミクスのモデリング、(3)ダイアログモデルへのドメイン知識の統合。
論文 参考訳(メタデータ) (2020-03-17T01:34:56Z) - Hierarchical Context Enhanced Multi-Domain Dialogue System for
Multi-domain Task Completion [17.66372217976539]
本稿では,提案した階層型文脈拡張対話システム(HCEDS)について述べる。
本システムの主な動機は,複雑な対話を十分に理解するための階層的文脈の可能性を包括的に探求することである。
その結果,本システムは自動評価において第1位,人的評価では第2位となることがわかった。
論文 参考訳(メタデータ) (2020-03-03T05:10:13Z) - Few-shot Natural Language Generation for Task-Oriented Dialog [113.07438787659859]
FewShotWozは,タスク指向対話システムにおける数ショットの学習設定をシミュレートする最初の NLG ベンチマークである。
我々は, SC-GPTモデルを開発し, その制御可能な生成能力を得るために, 注釈付きNLGコーパスの大規模なセットで事前学習を行った。
FewShotWozとMulti-Domain-WOZデータセットの実験は、提案したSC-GPTが既存の手法を大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2020-02-27T18:48:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。