論文の概要: Dual Learning for Dialogue State Tracking
- arxiv url: http://arxiv.org/abs/2009.10430v1
- Date: Tue, 22 Sep 2020 10:15:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 22:25:37.077512
- Title: Dual Learning for Dialogue State Tracking
- Title(参考訳): 対話状態追跡のためのデュアルラーニング
- Authors: Zhi Chen, Lu Chen, Yanbin Zhao, Su Zhu and Kai Yu
- Abstract要約: 対話状態追跡(DST)とは、各ターンの対話状態を推定することである。
複雑な対話履歴のコンテキストに依存するため、DSTデータアノテーションは単文言語理解よりも高価である。
ラベルのないデータを完全に活用するための新しい二元学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 44.679185483585364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In task-oriented multi-turn dialogue systems, dialogue state refers to a
compact representation of the user goal in the context of dialogue history.
Dialogue state tracking (DST) is to estimate the dialogue state at each turn.
Due to the dependency on complicated dialogue history contexts, DST data
annotation is more expensive than single-sentence language understanding, which
makes the task more challenging. In this work, we formulate DST as a sequence
generation problem and propose a novel dual-learning framework to make full use
of unlabeled data. In the dual-learning framework, there are two agents: the
primal tracker agent (utterance-to-state generator) and the dual utterance
generator agent (state-to-utterance genera-tor). Compared with traditional
supervised learning framework, dual learning can iteratively update both agents
through the reconstruction error and reward signal respectively without labeled
data. Reward sparsity problem is hard to solve in previous DST methods. In this
work, the reformulation of DST as a sequence generation model effectively
alleviates this problem. We call this primal tracker agent dual-DST.
Experimental results on MultiWOZ2.1 dataset show that the proposed dual-DST
works very well, especially when labelled data is limited. It achieves
comparable performance to the system where labeled data is fully used.
- Abstract(参考訳): タスク指向多ターン対話システムでは、対話状態は対話履歴の文脈においてユーザの目標のコンパクトな表現を指す。
対話状態追跡(DST)とは、各ターンの対話状態を推定することである。
複雑な対話履歴のコンテキストに依存しているため、DSTデータアノテーションは単文言語理解よりも高価である。
本研究では,DSTをシーケンス生成問題として定式化し,ラベルのないデータを完全に活用するための新しい2元学習フレームワークを提案する。
デュアルラーニングフレームワークでは、プライマルトラッカエージェント(発話から状態への生成)と2つの発話生成エージェント(状態から発話へのジェネラ-tor)という2つのエージェントがある。
従来の教師付き学習フレームワークと比較して、デュアルラーニングは、ラベル付きデータなしで、レコンストラクションエラーと報酬信号を介して、両方のエージェントを反復的に更新することができる。
逆空間問題は従来のDST法では解決が難しい。
本研究では、シーケンス生成モデルとしてのDSTの再構成により、この問題を効果的に緩和する。
我々はこの原始トラッカーエージェントをデュアルDSTと呼ぶ。
MultiWOZ2.1データセットの実験結果から、特にラベル付きデータが制限された場合、提案されたデュアルDSTが非常にうまく機能することが示された。
ラベル付きデータが完全に使用されるシステムに匹敵するパフォーマンスを実現する。
関連論文リスト
- Enhancing Dialogue State Tracking Models through LLM-backed User-Agents Simulation [12.93942316816741]
GPT-4はユーザとエージェントのインタラクションをシミュレートするために使用され、DSTラベルと数千の注釈付き対話を生成する。
生成されたデータとDST予測のための実データとに基づいて、LLaMA2の2段階微調整を行う。
我々のアプローチは、現実世界のシナリオにおける動的な要求に適応し、新しいドメインでの対話を迅速に生成することもできます。
論文 参考訳(メタデータ) (2024-05-17T07:00:05Z) - CSS: Combining Self-training and Self-supervised Learning for Few-shot
Dialogue State Tracking [36.18207750352937]
DST(Few-shot dialogue state tracking)は、ラベル付きデータでDSTモデルを訓練する現実的な問題である。
自己学習と自己教師型学習を組み合わせたDSTフレームワークCSSを提案する。
また,MultiWOZデータセットを用いた実験結果から,提案したCSSはいくつかのシナリオで競合性能を達成できた。
論文 参考訳(メタデータ) (2022-10-11T04:55:16Z) - OPAL: Ontology-Aware Pretrained Language Model for End-to-End
Task-Oriented Dialogue [40.62090743056549]
本稿では、エンドツーエンドタスク指向対話(TOD)のためのオントロジー対応事前学習言語モデル(OPAL)を提案する。
チャット型対話モデルとは異なり、タスク指向対話モデルは少なくとも2つのタスク固有モジュールを満たす:対話状態トラッカー(DST)と応答生成器(RG)。
論文 参考訳(メタデータ) (2022-09-10T04:38:27Z) - A Model-Agnostic Data Manipulation Method for Persona-based Dialogue
Generation [107.82729587882397]
現在のペルソナベースの対話データセットのスケールアップには費用がかかる。
このタスクの各データサンプルは、従来の対話データよりも複雑である。
本稿では,ペルソナをベースとした対話生成モデルにおいて,モデルに依存しないデータ操作手法を提案する。
論文 参考訳(メタデータ) (2022-04-21T03:49:54Z) - In-Context Learning for Few-Shot Dialogue State Tracking [55.91832381893181]
In-context (IC) Learning framework for few-shot dialogue state tracking (DST)を提案する。
大規模な事前訓練言語モデル(LM)は、テストインスタンスといくつかの注釈付き例を入力として取り、パラメータの更新なしに直接対話状態をデコードする。
これにより、LMは、新しいドメインやシナリオに適応する際の、以前の数ショットのDST作業と比べて、より柔軟でスケーラブルになります。
論文 参考訳(メタデータ) (2022-03-16T11:58:24Z) - Prompt Learning for Few-Shot Dialogue State Tracking [75.50701890035154]
本稿では,限られたラベル付きデータを用いて,対話状態追跡(DST)モデルを効率的に学習する方法に焦点を当てる。
本稿では,2つの主要なコンポーネントである値ベースプロンプトと逆プロンプト機構からなる,数ショットDSTのためのプロンプト学習フレームワークを設計する。
実験により、我々のモデルは未確認のスロットを生成し、既存の最先端の数ショット法より優れていることが示された。
論文 参考訳(メタデータ) (2022-01-15T07:37:33Z) - Improving Longer-range Dialogue State Tracking [22.606650177804966]
対話状態追跡(DST)はタスク指向対話システムにおいて重要な要素である。
本稿では,より長い対話処理を特に重視したDSTの全体的な性能向上を目指す。
論文 参考訳(メタデータ) (2021-02-27T02:44:28Z) - Conditioned Text Generation with Transfer for Closed-Domain Dialogue
Systems [65.48663492703557]
条件付き変分オートエンコーダを用いて,意図特化文の生成を最適に学習し,制御する方法を示す。
クエリ転送と呼ばれる新しいプロトコルを導入し、大規模で遅延のないデータセットを活用できるようにします。
論文 参考訳(メタデータ) (2020-11-03T14:06:10Z) - Improving Limited Labeled Dialogue State Tracking with Self-Supervision [91.68515201803986]
既存の対話状態追跡(DST)モデルには多くのラベル付きデータが必要である。
本稿では,潜在的一貫性の維持と対話行動のモデル化という,自己指導型の2つの目的について検討する。
提案する自己教師型信号は,1%のラベル付きデータのみを使用する場合,関節ゴール精度を8.95%向上させることができる。
論文 参考訳(メタデータ) (2020-10-26T21:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。