論文の概要: A Sequence-to-Sequence Approach to Dialogue State Tracking
- arxiv url: http://arxiv.org/abs/2011.09553v2
- Date: Sat, 29 May 2021 02:48:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 03:28:37.101612
- Title: A Sequence-to-Sequence Approach to Dialogue State Tracking
- Title(参考訳): 対話状態追跡のためのシーケンス・ツー・シーケンスアプローチ
- Authors: Yue Feng, Yang Wang, Hang Li
- Abstract要約: Seq2Seq-DUはシーケンス対シーケンス問題として対話状態追跡を形式化する。
インテント、スロット、スロットの値を共同でモデル化することができる。
分類スロットや非分類スロット、見えないスキーマを効果的に扱うことができる。
- 参考スコア(独自算出の注目度): 17.81139775400199
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper is concerned with dialogue state tracking (DST) in a task-oriented
dialogue system. Building a DST module that is highly effective is still a
challenging issue, although significant progresses have been made recently.
This paper proposes a new approach to dialogue state tracking, referred to as
Seq2Seq-DU, which formalizes DST as a sequence-to-sequence problem. Seq2Seq-DU
employs two BERT-based encoders to respectively encode the utterances in the
dialogue and the descriptions of schemas, an attender to calculate attentions
between the utterance embeddings and the schema embeddings, and a decoder to
generate pointers to represent the current state of dialogue. Seq2Seq-DU has
the following advantages. It can jointly model intents, slots, and slot values;
it can leverage the rich representations of utterances and schemas based on
BERT; it can effectively deal with categorical and non-categorical slots, and
unseen schemas. In addition, Seq2Seq-DU can also be used in the NLU (natural
language understanding) module of a dialogue system. Experimental results on
benchmark datasets in different settings (SGD, MultiWOZ2.2, MultiWOZ2.1,
WOZ2.0, DSTC2, M2M, SNIPS, and ATIS) show that Seq2Seq-DU outperforms the
existing methods.
- Abstract(参考訳): 本稿ではタスク指向対話システムにおける対話状態追跡(dst)について述べる。
高度に効果的なdstモジュールの構築は依然として課題であるが、近年は大きな進展が見られる。
本稿では,DSTをシーケンス対シーケンス問題として定式化したSeq2Seq-DUと呼ばれる対話状態追跡手法を提案する。
Seq2Seq-DUは、2つのBERTベースのエンコーダを使用して、対話中の発話とスキーマの記述をそれぞれエンコードする。
Seq2Seq-DUには次のような利点がある。
インテント、スロット、スロットの値を共同でモデル化し、BERTに基づく発話とスキーマのリッチな表現を活用でき、カテゴリや非カテゴリのスロットや目に見えないスキーマを効果的に扱うことができる。
さらに、Seq2Seq-DUは対話システムのNLUモジュールでも使用することができる。
異なる設定(sgd, multiwoz2.2, multiwoz2.1, woz2.0, dstc2, m2m, snips, atis)におけるベンチマークデータセットの実験結果は、seq2seq-duが既存のメソッドよりも優れていることを示している。
関連論文リスト
- Transforming Slot Schema Induction with Generative Dialogue State Inference [14.06505399101404]
スロットインジェクション(SSI)は、ラベルのない対話データからスロットを自動的に誘導することを目的としている。
本手法は,対話状態を表すための高品質な候補情報を検出する。
MultiWOZデータセットとSGDデータセットの実験的比較により、生成対話状態推論(Generative Dialogue State Inference, GenDSI)が従来の最先端よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-08-03T02:41:10Z) - Diable: Efficient Dialogue State Tracking as Operations on Tables [12.750160147987186]
本稿では,効率的な対話状態追跡システムの設計と実装を簡略化するタスクの形式化を提案する。
対話状態をテーブルとして表現し,テーブル操作タスクとしてDSTを定式化する。
各ターンで、システムは対話コンテキストに基づいてテーブル操作を生成することにより、前の状態を更新する。
論文 参考訳(メタデータ) (2023-05-26T15:26:12Z) - A Multi-Task BERT Model for Schema-Guided Dialogue State Tracking [78.2700757742992]
タスク指向対話システムは対話状態追跡器(DST)を用いて会話を完了させる。
最近の最先端のDST実装は、モデルの堅牢性を改善するために様々なサービスのスキーマに依存している。
本稿では,意図予測,要求スロット予測,スロットフィリングの3つのDSTタスクを協調的に解決する単一マルチタスクBERTモデルを提案する。
論文 参考訳(メタデータ) (2022-07-02T13:27:59Z) - In-Context Learning for Few-Shot Dialogue State Tracking [55.91832381893181]
In-context (IC) Learning framework for few-shot dialogue state tracking (DST)を提案する。
大規模な事前訓練言語モデル(LM)は、テストインスタンスといくつかの注釈付き例を入力として取り、パラメータの更新なしに直接対話状態をデコードする。
これにより、LMは、新しいドメインやシナリオに適応する際の、以前の数ショットのDST作業と比べて、より柔軟でスケーラブルになります。
論文 参考訳(メタデータ) (2022-03-16T11:58:24Z) - Extended Graph Temporal Classification for Multi-Speaker End-to-End ASR [77.82653227783447]
ニューラルネットワークによるラベル遷移とラベル遷移の両方をモデル化するための GTC の拡張を提案する。
例として,多話者音声認識タスクに拡張GTC(GTC-e)を用いる。
論文 参考訳(メタデータ) (2022-03-01T05:02:02Z) - Improving Mandarin End-to-End Speech Recognition with Word N-gram
Language Model [57.92200214957124]
外部言語モデル(LM)は、エンドツーエンド(E2E)自動音声認識(ASR)システムの音声認識性能を向上させることができる。
単語レベルの格子をオンザフライで構築し,可能なすべての単語列を考慮可能な,新しい復号アルゴリズムを提案する。
提案手法は,N-gram LMやニューラルネットワーク LM など,サブワードレベルのLMを一貫して上回る。
論文 参考訳(メタデータ) (2022-01-06T10:04:56Z) - Dialogue State Tracking with a Language Model using Schema-Driven
Prompting [18.83983018421701]
本稿では,スキーマ駆動型プロンプトを用いてタスク認識履歴エンコーディングを行う言語モデリング手法の新たなバリエーションを提案する。
我々の純生成システムは、MultiWOZ 2.2の最先端性能を実現し、MultiWOZ 2.1とM2Mの2つのベンチマークで競合性能を達成する。
論文 参考訳(メタデータ) (2021-09-15T18:11:25Z) - Dual Learning for Dialogue State Tracking [44.679185483585364]
対話状態追跡(DST)とは、各ターンの対話状態を推定することである。
複雑な対話履歴のコンテキストに依存するため、DSTデータアノテーションは単文言語理解よりも高価である。
ラベルのないデータを完全に活用するための新しい二元学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T10:15:09Z) - Video-Grounded Dialogues with Pretrained Generation Language Models [88.15419265622748]
我々は、ビデオ地上対話を改善するために、事前学習された言語モデルのパワーを利用する。
本稿では,シーケンス・ツー・グラウンドの対話タスクを,シーケンス・トゥ・グラウンドのタスクとして定式化するフレームワークを提案する。
我々のフレームワークは、微調整の言語モデルで複数のモダリティにまたがる依存関係をキャプチャできる。
論文 参考訳(メタデータ) (2020-06-27T08:24:26Z) - Efficient Context and Schema Fusion Networks for Multi-Domain Dialogue
State Tracking [32.36259992245]
対話状態追跡(DST)は、前回の会話のすべてから現在の対話状態を推定することを目的としている。
マルチドメインDSTでは、状態候補の数の増加と対話長の増加により、データ空間の問題が大きな障害となっている。
従来の対話状態(予測)と現在の対話発話をDSTの入力として利用する。
論文 参考訳(メタデータ) (2020-04-07T13:46:39Z) - Non-Autoregressive Dialog State Tracking [122.2328875457225]
非自己回帰的対話状態追跡(NADST)の新しい枠組みを提案する。
NADSTはドメインとスロット間の潜在的な依存関係を分解し、分離されたスロットではなく完全なセットとして対話状態の予測を改善するためにモデルを最適化する。
以上の結果から,MultiWOZ 2.1コーパス上の全領域にわたる最先端の接合精度が得られた。
論文 参考訳(メタデータ) (2020-02-19T06:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。