論文の概要: Continual Learning in Task-Oriented Dialogue Systems
- arxiv url: http://arxiv.org/abs/2012.15504v1
- Date: Thu, 31 Dec 2020 08:44:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 02:27:57.114363
- Title: Continual Learning in Task-Oriented Dialogue Systems
- Title(参考訳): タスク指向対話システムにおける連続学習
- Authors: Andrea Madotto, Zhaojiang Lin, Zhenpeng Zhou, Seungwhan Moon, Paul
Crook, Bing Liu, Zhou Yu, Eunjoon Cho, Zhiguang Wang
- Abstract要約: タスク指向対話システムにおける継続的な学習は、システム全体のリトレーニングのコストを伴わずに、時間を通じて新しいドメインや機能を追加できる。
37ドメインのタスク指向対話システムを4つの設定で継続的に学習するための継続的学習ベンチマークを提案する。
- 参考スコア(独自算出の注目度): 49.35627673523519
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Continual learning in task-oriented dialogue systems can allow us to add new
domains and functionalities through time without incurring the high cost of a
whole system retraining. In this paper, we propose a continual learning
benchmark for task-oriented dialogue systems with 37 domains to be learned
continuously in four settings, such as intent recognition, state tracking,
natural language generation, and end-to-end. Moreover, we implement and compare
multiple existing continual learning baselines, and we propose a simple yet
effective architectural method based on residual adapters. Our experiments
demonstrate that the proposed architectural method and a simple replay-based
strategy perform comparably well but they both achieve inferior performance to
the multi-task learning baseline, in where all the data are shown at once,
showing that continual learning in task-oriented dialogue systems is a
challenging task. Furthermore, we reveal several trade-offs between different
continual learning methods in term of parameter usage and memory size, which
are important in the design of a task-oriented dialogue system. The proposed
benchmark is released together with several baselines to promote more research
in this direction.
- Abstract(参考訳): タスク指向対話システムにおける継続的な学習は、システム全体のリトレーニングのコストを伴わずに、時間を通じて新しいドメインや機能を追加できる。
本稿では,37ドメインのタスク指向対話システムに対して,意図認識,状態追跡,自然言語生成,エンドツーエンドの4つの設定で連続的に学習するための連続学習ベンチマークを提案する。
さらに,既存の学習ベースラインを複数実装・比較し,残差アダプタをベースとした簡易かつ効果的なアーキテクチャ手法を提案する。
提案手法と簡単なリプレイ型戦略は相容れない性能を示したが、同時に全てのデータが同時に表示されるマルチタスク学習ベースラインに劣る性能を達成し、タスク指向対話システムにおける連続学習が課題であることを示す。
さらに,タスク指向対話システムの設計において重要なパラメータ使用量とメモリサイズの観点から,複数の連続学習手法のトレードオフを明らかにした。
提案されたベンチマークは、この方向のさらなる研究を促進するために、いくつかのベースラインと共にリリースされている。
関連論文リスト
- Continual Dialogue State Tracking via Example-Guided Question Answering [48.31523413835549]
そこで本研究では,対話状態の追跡を具体化した質問応答タスクのバンドルとして提案する。
我々のアプローチは、サービス固有の記憶を緩和し、与えられた質問や例を文脈化するためのモデルを教える。
類似の対話状態変化のあるターンを識別するために訓練された検索者によって検索されたコンテキスト内例から学習することで,600万のパラメータしか持たないモデルが大きな向上を達成できることがわかった。
論文 参考訳(メタデータ) (2023-05-23T06:15:43Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Utterance Rewriting with Contrastive Learning in Multi-turn Dialogue [22.103162555263143]
比較学習とマルチタスク学習を導入し、問題を共同でモデル化する。
提案手法は,複数の公開データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-22T10:13:27Z) - Continual Prompt Tuning for Dialog State Tracking [58.66412648276873]
望ましいダイアログシステムは、古いスキルを忘れずに継続的に新しいスキルを学ぶことができるべきである。
本稿では,タスク間の知識伝達を可能にするパラメータ効率フレームワークであるContinuous Prompt Tuningを提案する。
論文 参考訳(メタデータ) (2022-03-13T13:22:41Z) - Retrieve & Memorize: Dialog Policy Learning with Multi-Action Memory [13.469140432108151]
本稿では,システム行動の学習を促進するための検索・記憶フレームワークを提案する。
メモリ拡張型マルチデコーダネットワークを用いて、候補動作に条件付きシステム動作を生成する。
本手法は,コンテキスト・ツー・レスポンス生成タスクにおける最先端モデル間の競合性能を実現する。
論文 参考訳(メタデータ) (2021-06-04T07:53:56Z) - Rethinking Supervised Learning and Reinforcement Learning in
Task-Oriented Dialogue Systems [58.724629408229205]
本稿では、従来の教師あり学習とシミュレータなしの逆学習法を用いて、最先端のRL法に匹敵する性能を実現する方法を示す。
我々の主な目的は、教師あり学習で強化学習に勝ることではなく、タスク指向対話システムの最適化における強化学習と教師あり学習の役割を再考する価値を示すことである。
論文 参考訳(メタデータ) (2020-09-21T12:04:18Z) - Recent Advances and Challenges in Task-oriented Dialog System [63.82055978899631]
課題指向対話システムは、学術・産業社会でますます注目を集めている。
タスク指向ダイアログシステムにおける3つの重要なトピックについて論じる。(1)低リソース環境でのダイアログモデリングを容易にするデータ効率の改善、(2)ダイアログポリシー学習のためのマルチターンダイナミクスのモデリング、(3)ダイアログモデルへのドメイン知識の統合。
論文 参考訳(メタデータ) (2020-03-17T01:34:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。