論文の概要: Comparing Data Augmentation Methods for End-to-End Task-Oriented Dialog Systems
- arxiv url: http://arxiv.org/abs/2406.06127v1
- Date: Mon, 10 Jun 2024 09:36:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 14:27:16.912097
- Title: Comparing Data Augmentation Methods for End-to-End Task-Oriented Dialog Systems
- Title(参考訳): タスク指向対話システムにおけるデータ拡張手法の比較
- Authors: Christos Vlachos, Themos Stafylakis, Ion Androutsopoulos,
- Abstract要約: データ拡張(DA)は他のNLPシステムで成功しているが、ToDSでは広く研究されていない。
エンド・ツー・エンドのToDS設定におけるDA手法の有効性を実証的に評価した。
本研究では,3種類のDA手法(単語レベル,文レベル,ダイアログレベル)を,ToDSや他のNLPシステムにおいて有望な結果を示す8つのDA手法と比較する。
- 参考スコア(独自算出の注目度): 16.193477346643295
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating effective and reliable task-oriented dialog systems (ToDSs) is challenging, not only because of the complex structure of these systems, but also due to the scarcity of training data, especially when several modules need to be trained separately, each one with its own input/output training examples. Data augmentation (DA), whereby synthetic training examples are added to the training data, has been successful in other NLP systems, but has not been explored as extensively in ToDSs. We empirically evaluate the effectiveness of DA methods in an end-to-end ToDS setting, where a single system is trained to handle all processing stages, from user inputs to system outputs. We experiment with two ToDSs (UBAR, GALAXY) on two datasets (MultiWOZ, KVRET). We consider three types of DA methods (word-level, sentence-level, dialog-level), comparing eight DA methods that have shown promising results in ToDSs and other NLP systems. We show that all DA methods considered are beneficial, and we highlight the best ones, also providing advice to practitioners. We also introduce a more challenging few-shot cross-domain ToDS setting, reaching similar conclusions.
- Abstract(参考訳): 効果的で信頼性の高いタスク指向対話システム(ToDS)の作成は、これらのシステムの複雑な構造のためだけでなく、トレーニングデータの不足、特に複数のモジュールを個別にトレーニングする必要がある場合、それぞれに独自のインプット/アウトプットトレーニング例があるため、困難である。
データ強化(DA)は、トレーニングデータに合成トレーニングサンプルを追加することで、他のNLPシステムで成功しているが、ToDSでは広く研究されていない。
エンド・ツー・エンドのToDS設定におけるDA手法の有効性を実証的に評価し,ユーザ入力からシステム出力まで,単一のシステムが全ての処理段階を処理するように訓練する。
2つのデータセット(MultiWOZ, KVRET)で2つのToDS(UBAR, GALAXY)を実験した。
本研究では,3種類のDA手法(単語レベル,文レベル,ダイアログレベル)を,ToDSや他のNLPシステムにおいて有望な結果を示す8つのDA手法と比較する。
考慮されたすべてのDAメソッドが有用であることを示し、ベストプラクティスを強調し、実践者にアドバイスを提供する。
また、より挑戦的なクロスドメインのToDS設定を導入し、同様の結論に達しました。
関連論文リスト
- A Systematic Study of Performance Disparities in Multilingual
Task-Oriented Dialogue Systems [68.76102493999134]
マルチリンガルなタスク指向対話システム間に存在するタスクパフォーマンスの相違を,実証的に分析し,分析する。
我々は現在のToDシステムにおける適応と本質的バイアスの存在を証明した。
本稿では,新しい言語に対するToDデータ収集とシステム開発へのアプローチについて,実践的なヒントを提供する。
論文 参考訳(メタデータ) (2023-10-19T16:41:44Z) - InstructTODS: Large Language Models for End-to-End Task-Oriented
Dialogue Systems [60.53276524369498]
大規模言語モデル(LLM)は自然言語処理(NLP)における多様なタスクに使用されている。
InstructTODSは、ゼロショットのタスク指向対話システムのための新しいフレームワークである。
InstructTODSは、ユーザの意図を動的クエリにシームレスに翻訳するプロキシの信念状態を生成する。
論文 参考訳(メタデータ) (2023-10-13T06:36:26Z) - Knowledge-Retrieval Task-Oriented Dialog Systems with Semi-Supervision [22.249113574918034]
既存のタスク指向ダイアログ(TOD)システムは、スロットと値の観点からダイアログの状態を追跡し、データベースに問い合わせて応答を生成する。
現実のアプリケーションでは,ユーザの発話がノイズが多いため,対話状態を正確に追跡し,関連する知識を正しく確保することは困難である。
そこで本研究では,TODシステムにおける知識選択を高速化する検索手法を提案する。
論文 参考訳(メタデータ) (2023-05-22T16:29:20Z) - Unified Demonstration Retriever for In-Context Learning [56.06473069923567]
Unified Demonstration Retriever (textbfUDR)は、幅広いタスクのデモを検索する単一のモデルである。
我々は,高品質な候補を見つけるための反復的なマイニング戦略を備えたマルチタスクリストワイド・トレーニング・フレームワークを提案する。
13のタスクファミリーと複数のデータドメインにわたる30以上のタスクの実験は、UDRがベースラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2023-05-07T16:07:11Z) - Task-Optimized Adapters for an End-to-End Task-Oriented Dialogue System [0.0]
本稿では,タスク毎に個別に学習し,事前学習したネットワークの固定層に少数のパラメータを追加するタスク・ド・アダプタを用いたエンドツーエンドTODシステムを提案する。
提案手法はモデルに依存しない手法であり,プロンプトを使わずに入力データのみをプロンプトチューニングする必要がない。
論文 参考訳(メタデータ) (2023-05-04T00:17:49Z) - ICL-D3IE: In-Context Learning with Diverse Demonstrations Updating for
Document Information Extraction [56.790794611002106]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて、文脈内学習による顕著な結果を示している。
ICL-D3IEと呼ばれるシンプルだが効果的なテキスト内学習フレームワークを提案する。
具体的には、ハードトレーニング文書から最も困難で独特なセグメントをハードデモとして抽出する。
論文 参考訳(メタデータ) (2023-03-09T06:24:50Z) - CINS: Comprehensive Instruction for Few-shot Learning in Task-oriented
Dialog Systems [56.302581679816775]
本稿では,タスク固有の命令でPLMを利用する包括的インストラクション(CINS)を提案する。
命令のスキーマ(定義、制約、プロンプト)と、ToDの3つの重要な下流タスクに対するカスタマイズされた実現を設計する。
これらのToDタスクに対して,小さな検証データを用いた現実的な数ショット学習シナリオで実験を行った。
論文 参考訳(メタデータ) (2021-09-10T03:23:06Z) - Self-training Improves Pre-training for Few-shot Learning in
Task-oriented Dialog Systems [47.937191088981436]
大規模事前訓練型言語モデルでは、ToDで数発の学習を行う上で有望な結果が示されている。
本稿では,より強力な学生モデルを訓練するために,最も自信のないラベル付きデータを反復的にラベル付けする自己学習手法を提案する。
目的分類,ダイアログ状態追跡,ダイアログアクト予測,応答選択など,ToDの4つの下流タスクに関する実験と分析を行った。
論文 参考訳(メタデータ) (2021-08-28T07:22:06Z) - Learning Dialog Policies from Weak Demonstrations [32.149932955715705]
Demonstrations (DQfD) からの深層Q-learningを構築し,ダイアログデータを利用してエージェントを誘導し,ユーザの要求に応答する。
ラベル付きデータ、ラベル付きデータ、さらにはラベルなしデータを使って、必要なデータに関する仮定を徐々に減らします。
挑戦的なマルチドメインダイアログシステムフレームワークの実験は、我々のアプローチを検証し、ドメイン外のデータでトレーニングしても高い成功率を得る。
論文 参考訳(メタデータ) (2020-04-23T10:22:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。