論文の概要: Jointly Reinforced User Simulator and Task-oriented Dialog System with
Simplified Generative Architecture
- arxiv url: http://arxiv.org/abs/2210.06706v1
- Date: Thu, 13 Oct 2022 03:57:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 14:02:02.199385
- Title: Jointly Reinforced User Simulator and Task-oriented Dialog System with
Simplified Generative Architecture
- Title(参考訳): 簡易生成アーキテクチャを用いた統合強化ユーザシミュレータとタスク指向対話システム
- Authors: Hong Liu, Zhijian Ou, Yi Huang and Junlan Feng
- Abstract要約: GPT-2ベースのダイアログシステム(DS)とエンドユーザシミュレータ(US)のオンライン強化学習は、これまで検討されていない。
本稿ではまず,GPT-2に基づくDSとUS用のSGA(Simplified Generative Architectures)を提案する。
提案するSGAを用いたDSは,MultiWOZ2.1上での最先端性能を実現し,学習と生成の両面で計算効率が向上する。
- 参考スコア(独自算出の注目度): 24.305558215176752
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, there has been progress in supervised funetuning pretrained GPT-2
to build end-to-end task-oriented dialog (TOD) systems. However, online
reinforcement learning of a GPT-2 based dialog system (DS), together with a
end-to-end user simulator (US), has not ever been explored. Moreover, a
drawback with existing GPT-2 based TOD systems is that they mostly employ the
whole dialog history as input, which brings inefficiencies in memory and
compute. In this paper, we first propose Simplified Generative Architectures
(SGA) for DS and US respectively, both based on GPT-2 but using shortened
history. Then, we successfully develop Jointly Reinforced US and DS, called
SGA-JRUD. Our DS with the proposed SGA, when only supervised trained, achieves
state-of-the-art performance on MultiWOZ2.1 and is more compute-efficient in
both training and generation. Extensive experiments on MultiWOZ2.1 further show
the superiority of SGA-JRUD in both offline and online evaluations.
- Abstract(参考訳): 近年、タスク指向ダイアログ(tod)システムを構築するために事前訓練されたgpt-2の監督が進められている。
しかし、GPT-2ベースの対話システム(DS)とエンドユーザシミュレータ(US)を併用したオンライン強化学習は行われていない。
さらに、既存のGPT-2ベースのTODシステムの欠点は、主にダイアログ履歴全体を入力として利用し、メモリと計算に非効率をもたらすことである。
本稿ではまず,GPT-2に基づくDSとUS用のSGA(Simplified Generative Architectures)を提案する。
そこで我々は,SGA-JRUDと呼ばれる統合強化USとDSの開発に成功した。
提案するSGAを用いたDSは,MultiWOZ2.1上での最先端性能を実現し,学習と生成の両面で計算効率が向上する。
MultiWOZ2.1の大規模な実験は、オフラインおよびオンライン両方の評価においてSGA-JRUDの優位性を示している。
関連論文リスト
- The 2nd FutureDial Challenge: Dialog Systems with Retrieval Augmented Generation (FutureDial-RAG) [23.849336345191556]
この課題は、3000近い高品質なダイアログを備えた実際の顧客サービスデータセットであるMobileCS2データセットの上に構築されている。
本稿では,知識検索のためのトラック1と応答生成のためのトラック2という2つのタスクを定義する。
我々は,2つのトラックのベースラインシステムを構築し,そのシステムが正確な検索を行い,情報的かつ一貫性のある応答を生成できるかどうかを計測する。
論文 参考訳(メタデータ) (2024-05-21T07:35:21Z) - InstructTODS: Large Language Models for End-to-End Task-Oriented
Dialogue Systems [60.53276524369498]
大規模言語モデル(LLM)は自然言語処理(NLP)における多様なタスクに使用されている。
InstructTODSは、ゼロショットのタスク指向対話システムのための新しいフレームワークである。
InstructTODSは、ユーザの意図を動的クエリにシームレスに翻訳するプロキシの信念状態を生成する。
論文 参考訳(メタデータ) (2023-10-13T06:36:26Z) - Enhancing Performance on Seen and Unseen Dialogue Scenarios using
Retrieval-Augmented End-to-End Task-Oriented System [89.40590076430297]
この作業により、単純なキャッシュを通じてより柔軟性のあるTODシステムが可能になる。
我々は,TOD生成中に対話履歴と検索情報の両方を参照・基盤にできるエンドツーエンドTODモデルを訓練する。
非空共同ゴール精度を6.7%向上させるなど,我々のフレームワークの優れた性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-08-16T06:52:10Z) - Semi-Supervised Knowledge-Grounded Pre-training for Task-Oriented Dialog
Systems [25.164042288343683]
半教師付き/強化TODシステム構築における最初の課題である,SereTOD 2022 チャレンジのトラック2のモデルを提案する。
我々は,対話履歴とローカルKBを入力として定式化し,システム応答を予測するための知識基底ダイアログモデルを構築した。
また,ラベル付きデータとラベルなしデータの両方で,半教師付き事前学習を行う。
論文 参考訳(メタデータ) (2022-10-17T09:10:03Z) - A Generative User Simulator with GPT-based Architecture and Goal State
Tracking for Reinforced Multi-Domain Dialog Systems [22.249113574918034]
GPT-2に基づくアーキテクチャと目標状態追跡を備えた生成ユーザシミュレータ(GUS)を提案する。
GUSは3つの評価課題すべてにおいて優れた結果を得る。
論文 参考訳(メタデータ) (2022-10-17T01:57:50Z) - A Multi-Task BERT Model for Schema-Guided Dialogue State Tracking [78.2700757742992]
タスク指向対話システムは対話状態追跡器(DST)を用いて会話を完了させる。
最近の最先端のDST実装は、モデルの堅牢性を改善するために様々なサービスのスキーマに依存している。
本稿では,意図予測,要求スロット予測,スロットフィリングの3つのDSTタスクを協調的に解決する単一マルチタスクBERTモデルを提案する。
論文 参考訳(メタデータ) (2022-07-02T13:27:59Z) - Revisiting Markovian Generative Architectures for Efficient
Task-Oriented Dialog Systems [22.249113574918034]
我々は,従来のLSTMベースのTODシステムで使用されていたマルコフ生成アーキテクチャ (MGA) を再検討することを提案する。
MultiWOZ2.1の実験は、提案されたマルコフ的 PLM ベースのシステムの非マルコフ的システムに対する効率上の利点を示している。
論文 参考訳(メタデータ) (2022-04-13T15:21:34Z) - HyKnow: End-to-End Task-Oriented Dialog Modeling with Hybrid Knowledge
Management [58.82499963373537]
ハイブリッドナレッジ管理のTODシステム「HyKnow」を提案します。
構造的知識と非構造的知識の両方を管理するための信念状態を拡張する。
この2つの知識に基づくモデリングを共同で最適化した最初のエンドツーエンドモデルである。
論文 参考訳(メタデータ) (2021-05-13T01:58:39Z) - A Hybrid Task-Oriented Dialog System with Domain and Task Adaptive
Pretraining [25.674966922466467]
本稿では,第9回ダイアログ・システム・テクノロジー・チャレンジ(DSTC-9)におけるエンド・ツー・エンドマルチドメインタスク・コンプリート・ダイアログ共有タスクについて述べる。
共有タスクの参加者は、人的評価とユーザシミュレータによる自動評価により評価されるエンドツーエンドのタスク完了ダイアログシステムを構築する。
論文 参考訳(メタデータ) (2021-02-08T20:02:30Z) - MinTL: Minimalist Transfer Learning for Task-Oriented Dialogue Systems [75.43457658815943]
タスク指向対話システムのシステム設計プロセスを簡単にするミニマリスト変換学習(MinTL)を提案する。
MinTLはシンプルだが効果的な転送学習フレームワークであり、事前訓練されたSeq2seqモデルのプラグインと再生を可能にする。
トレーニング済みの2つのバックボーン(T5とBART)で学習フレームワークをインスタンス化し、MultiWOZで評価する。
論文 参考訳(メタデータ) (2020-09-25T02:19:13Z) - Modelling Hierarchical Structure between Dialogue Policy and Natural
Language Generator with Option Framework for Task-oriented Dialogue System [49.39150449455407]
HDNOは、特定の対話行為表現の設計を避けるために潜在対話行為を設計するためのオプションフレームワークである。
RL,LaRL,HDSAで学習した単語レベルE2Eモデルと比較して,マルチドメイン対話のデータセットであるMultiWoz 2.0とMultiWoz 2.1でHDNOをテストする。
論文 参考訳(メタデータ) (2020-06-11T20:55:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。