論文の概要: Transferable Dialogue Systems and User Simulators
- arxiv url: http://arxiv.org/abs/2107.11904v1
- Date: Sun, 25 Jul 2021 22:59:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-27 16:25:57.426598
- Title: Transferable Dialogue Systems and User Simulators
- Title(参考訳): 転送可能な対話システムとユーザシミュレータ
- Authors: Bo-Hsiang Tseng, Yinpei Dai, Florian Kreyssig, Bill Byrne
- Abstract要約: 対話システムのトレーニングの難しさの1つは、トレーニングデータの欠如である。
本稿では,対話システムとユーザシミュレータ間の対話を通して対話データを作成する可能性について検討する。
我々は,2つのエージェント間のセルフプレイを通じて,新たな対話シナリオを組み込むことのできるモデリングフレームワークを開発する。
- 参考スコア(独自算出の注目度): 17.106518400787156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the difficulties in training dialogue systems is the lack of training
data. We explore the possibility of creating dialogue data through the
interaction between a dialogue system and a user simulator. Our goal is to
develop a modelling framework that can incorporate new dialogue scenarios
through self-play between the two agents. In this framework, we first pre-train
the two agents on a collection of source domain dialogues, which equips the
agents to converse with each other via natural language. With further
fine-tuning on a small amount of target domain data, the agents continue to
interact with the aim of improving their behaviors using reinforcement learning
with structured reward functions. In experiments on the MultiWOZ dataset, two
practical transfer learning problems are investigated: 1) domain adaptation and
2) single-to-multiple domain transfer. We demonstrate that the proposed
framework is highly effective in bootstrapping the performance of the two
agents in transfer learning. We also show that our method leads to improvements
in dialogue system performance on complete datasets.
- Abstract(参考訳): 対話システムの訓練の難しさの1つは、訓練データの欠如である。
対話システムとユーザシミュレータとのインタラクションを通じて対話データを作成する可能性を検討する。
私たちの目標は、2つのエージェント間の自己再生を通じて、新しい対話シナリオを組み込むことができるモデリングフレームワークの開発です。
このフレームワークでは、まず2つのエージェントをソースドメインの対話の集まりで事前トレーニングし、エージェントが自然言語を介して互いに会話するようにします。
少量のターゲットドメインデータに対するさらなる微調整により、エージェントは構造化報酬関数を用いた強化学習を用いて、彼らの行動を改善する目的と対話し続けます。
マルチウォズデータセットを用いた実験では,1)ドメイン適応と2)1対複数ドメイン転送という2つの実用的なトランスファー学習問題について検討した。
提案手法は,転送学習における2つのエージェントの性能のブートストラップに極めて有効であることを示す。
また,本手法が完全なデータセット上での対話システム性能の向上につながることを示す。
関連論文リスト
- Injecting Salesperson's Dialogue Strategies in Large Language Models with Chain-of-Thought Reasoning [23.919423630938226]
SalesBotは、Chit-chatからタスク指向のシナリオへ移行し、セールスエージェントをトレーニングする対話をシミュレートする。
最初のデータはスムーズなトランジションとコヒーレントなロングターンダイアログを欠いていたため、セールス・カストマー相互作用の自然性が低かった。
営業担当者のインタラクションを学習し,チェーン・オブ・ソート(CoT)推論を用いた新しいモデル「SalesAgent」を紹介した。
論文 参考訳(メタデータ) (2024-04-29T10:12:04Z) - DIONYSUS: A Pre-trained Model for Low-Resource Dialogue Summarization [127.714919036388]
DIONYSUSは、任意の新しいドメインでの対話を要約するための訓練済みエンコーダデコーダモデルである。
実験の結果,DIONYSUSは6つのデータセット上で既存の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-12-20T06:21:21Z) - Manual-Guided Dialogue for Flexible Conversational Agents [84.46598430403886]
対話データを効率的に構築し、利用する方法や、さまざまなドメインにモデルを大規模にデプロイする方法は、タスク指向の対話システムを構築する上で重要な問題である。
エージェントは対話とマニュアルの両方からタスクを学習する。
提案手法は,詳細なドメインオントロジーに対する対話モデルの依存性を低減し,様々なドメインへの適応をより柔軟にする。
論文 参考訳(メタデータ) (2022-08-16T08:21:12Z) - DialogZoo: Large-Scale Dialog-Oriented Task Learning [52.18193690394549]
我々は,多種多様な対話課題を解くための統合基盤モデルの構築を目指している。
この目的を達成するために、73の公開データセットから、まず大規模なラベル付き対話データセットを収集する。
論文 参考訳(メタデータ) (2022-05-25T11:17:16Z) - Quick Starting Dialog Systems with Paraphrase Generation [0.0]
本稿では,既存の事例からより多くのデータを人工的に生成することで,対話エージェント作成のコストと労力を削減する手法を提案する。
提案手法は,人間の努力がほとんどないダイアログシステムを起動し,実際のエンドユーザーとの対話を可能にするのに十分なレベルの性能を実現する。
論文 参考訳(メタデータ) (2022-04-06T02:35:59Z) - Integrating Pre-trained Model into Rule-based Dialogue Management [32.90885176553305]
ルールベースの対話管理は、まだ産業用タスク指向対話システムのための最も人気のあるソリューションです。
データ駆動対話システム(通常はエンドツーエンド構造)は学術研究で人気がある。
本稿ではルールベースとデータ駆動型ダイアログマネージャの長所を活用する手法を提案する。
論文 参考訳(メタデータ) (2021-02-17T03:44:22Z) - Improving Dialogue Breakdown Detection with Semi-Supervised Learning [7.7914806980889875]
そこで本研究では,セミ教師あり学習手法を用いて対話分解の検出を改善することを提案する。
本研究は,DBDC(Dilogue Breakdown Detection Challenge)英語共有タスクにおいて,これらの手法の有効性を示す。
論文 参考訳(メタデータ) (2020-10-30T23:04:56Z) - MinTL: Minimalist Transfer Learning for Task-Oriented Dialogue Systems [75.43457658815943]
タスク指向対話システムのシステム設計プロセスを簡単にするミニマリスト変換学習(MinTL)を提案する。
MinTLはシンプルだが効果的な転送学習フレームワークであり、事前訓練されたSeq2seqモデルのプラグインと再生を可能にする。
トレーニング済みの2つのバックボーン(T5とBART)で学習フレームワークをインスタンス化し、MultiWOZで評価する。
論文 参考訳(メタデータ) (2020-09-25T02:19:13Z) - Meta Dialogue Policy Learning [58.045067703675095]
我々は、ドメイン間の共有可能な低レベル信号を利用するために、Deep Transferable Q-Network (DTQN)を提案する。
状態と行動表現空間をこれらの低レベル成分に対応する特徴部分空間に分解する。
実験において,本モデルは,成功率と対話効率の両方の観点から,ベースラインモデルより優れている。
論文 参考訳(メタデータ) (2020-06-03T23:53:06Z) - Multi-Agent Task-Oriented Dialog Policy Learning with Role-Aware Reward
Decomposition [64.06167416127386]
本稿では,システムとユーザの両方をダイアログエージェントとみなすマルチエージェントダイアログポリシー学習を提案する。
2人のエージェントが互いに相互作用し、同時に一緒に学習されます。
その結果,本手法がシステムポリシとユーザポリシを同時に構築できることが示唆された。
論文 参考訳(メタデータ) (2020-04-08T04:51:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。