論文の概要: Domain State Tracking for a Simplified Dialogue System
- arxiv url: http://arxiv.org/abs/2103.06648v1
- Date: Thu, 11 Mar 2021 13:00:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 04:55:32.316577
- Title: Domain State Tracking for a Simplified Dialogue System
- Title(参考訳): 簡易対話システムのためのドメイン状態追跡
- Authors: Hyunmin Jeon, Gary Geunbae Lee
- Abstract要約: 対話履歴全体ではなく,入力コンテキストを簡略化したタスク指向対話システムであるdotsを提案する。
DoTSは、MultiWOZの以前の最先端モデルと比較して、それぞれ1.09ポイントと1.24ポイントのインフォメーションレートと成功率を改善する。
- 参考スコア(独自算出の注目度): 3.962145079528281
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Task-oriented dialogue systems aim to help users achieve their goals in
specific domains. Recent neural dialogue systems use the entire dialogue
history for abundant contextual information accumulated over multiple
conversational turns. However, the dialogue history becomes increasingly longer
as the number of turns increases, thereby increasing memory usage and
computational costs. In this paper, we present DoTS (Domain State Tracking for
a Simplified Dialogue System), a task-oriented dialogue system that uses a
simplified input context instead of the entire dialogue history. However,
neglecting the dialogue history can result in a loss of contextual information
from previous conversational turns. To address this issue, DoTS tracks the
domain state in addition to the belief state and uses it for the input context.
Using this simplified input, DoTS improves the inform rate and success rate by
1.09 points and 1.24 points, respectively, compared to the previous
state-of-the-art model on MultiWOZ, which is a well-known benchmark.
- Abstract(参考訳): タスク指向の対話システムは、ユーザが特定の領域で目標を達成できるようにする。
最近のニューラルダイアログシステムでは、対話履歴全体を用いて、複数の会話のターンに蓄積された豊富なコンテキスト情報を利用する。
しかし、ターン数が増加するにつれて対話の歴史は長くなるため、メモリ使用量や計算コストが増大する。
本稿では,対話履歴全体ではなく,入力コンテキストを簡略化したタスク指向対話システムであるDoTS(Domain State Tracking for a Simplified Dialogue System)について述べる。
しかし、対話履歴を無視すると、以前の会話の交代から文脈情報が失われる可能性がある。
この問題に対処するため、DoTSは信念状態に加えてドメインの状態を追跡し、入力コンテキストに使用します。
この単純化された入力を用いて、DoTSは、よく知られたベンチマークであるMultiWOZの以前の最先端モデルと比較して、インフォメーションレートと成功率を1.09ポイントと1.24ポイント改善する。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Adapting Text-based Dialogue State Tracker for Spoken Dialogues [20.139351605832665]
本稿では,DSTC11における音声認識対話システム技術課題トラックに参画した,高度に成功を収めたモデルの構築に向けた技術的取り組みについて述べる。
本モデルは,(1)音声音声とテキスト音声のギャップを埋める自動音声認識誤差補正,(2)スロット記述を用いてスロットと値を推定するテキストベース対話システム(D3ST),(3)推定スロット値の誤差を復元する後処理の3つの主要モジュールから構成される。
論文 参考訳(メタデータ) (2023-08-29T06:27:58Z) - PK-Chat: Pointer Network Guided Knowledge Driven Generative Dialogue
Model [79.64376762489164]
PK-Chatは、知識グラフ上のポインタネットワークと、事前訓練された言語モデルを組み合わせた、ポインタネットワーク誘導生成対話モデルである。
PK-Chatが対話で生成した単語は、単語リストの予測と外部知識グラフ知識の直接予測から導かれる。
PK-Chatに基づく対話システムは、地球科学の学術シナリオ向けに構築されている。
論文 参考訳(メタデータ) (2023-04-02T18:23:13Z) - A Benchmark for Understanding and Generating Dialogue between Characters
in Stories [75.29466820496913]
本研究は,機械が物語の対話を理解・生成できるかどうかを探求する最初の研究である。
マスク付き対話生成と対話話者認識という2つの新しいタスクを提案する。
DialStoryの自動評価と手動評価で既存のモデルをテストすることで,提案課題の難しさを示す。
論文 参考訳(メタデータ) (2022-09-18T10:19:04Z) - Multimodal Dialogue State Tracking [97.25466640240619]
Video-Dialogue Transformer Network (VDTN)は、ビデオと対話の間のコンテキスト依存を学習し、マルチモーダル対話状態を生成する。
VDTNは、オブジェクトレベルの特徴とセグメントレベルの特徴を組み合わせて、ビデオと対話の間のコンテキスト依存を学び、マルチモーダルな対話状態を生成する。
論文 参考訳(メタデータ) (2022-06-16T03:18:42Z) - Beyond the Granularity: Multi-Perspective Dialogue Collaborative
Selection for Dialogue State Tracking [18.172993687706708]
対話状態追跡においては、対話履歴は重要な材料であり、その利用法は異なるモデルによって異なる。
状態更新のために各スロットに対応する対話内容を動的に選択するDiCoS-DSTを提案する。
提案手法は,MultiWOZ 2.1およびMultiWOZ 2.2上での最先端性能を実現し,複数の主流ベンチマークデータセット上での優れた性能を実現する。
論文 参考訳(メタデータ) (2022-05-20T10:08:45Z) - HybriDialogue: An Information-Seeking Dialogue Dataset Grounded on
Tabular and Textual Data [87.67278915655712]
我々は、ウィキペディアのテキストとテーブルの両方を基盤とした、クラウドソーシングされた自然な会話からなる新しい対話データセットHybriDialogueを提示する。
これらの会話は、複雑なマルチホップ質問をシンプルで現実的なマルチターン対話に分解することで生成される。
論文 参考訳(メタデータ) (2022-04-28T00:52:16Z) - Integrating Dialog History into End-to-End Spoken Language Understanding
Systems [37.08876551722831]
対話履歴の重要性と、それをエンドツーエンドの音声言語理解システムに効果的に組み込む方法について検討する。
音声音声を処理しながら,提案したRNNトランスデューサ(RNN-T)に基づくSLUモデルでは,そのダイアログ履歴を復号化文字とSLUラベルの形式でアクセスすることができる。
我々は最近リリースされた音声対話データセットであるHarperValleyBank corpusに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-08-18T22:24:11Z) - Comprehensive Study: How the Context Information of Different
Granularity Affects Dialogue State Tracking? [17.476030563395714]
対話状態追跡(DST)は、ユーザの目標を監視するためにタスク指向の対話システムにおいて重要な役割を果たす。
一般的に、対話状態の追跡には2つの戦略がある: スクラッチから予測し、それ以前の状態から更新する。
論文 参考訳(メタデータ) (2021-05-08T03:18:13Z) - Rethinking Dialogue State Tracking with Reasoning [76.0991910623001]
本稿では, 対話状態の段階的追跡を, バックエンドデータの助けを借りて行うことを提案する。
実験の結果,MultiWOZ 2.1の連立信条精度は38.6%向上した。
論文 参考訳(メタデータ) (2020-05-27T02:05:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。