論文の概要: Learn to Focus: Hierarchical Dynamic Copy Network for Dialogue State
Tracking
- arxiv url: http://arxiv.org/abs/2107.11778v1
- Date: Sun, 25 Jul 2021 10:43:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 02:18:06.857715
- Title: Learn to Focus: Hierarchical Dynamic Copy Network for Dialogue State
Tracking
- Title(参考訳): 集中学習:対話状態追跡のための階層型動的コピーネットワーク
- Authors: Linhao Zhang, Houfeng Wang
- Abstract要約: 階層型動的コピーネットワーク(HDCN)を提案する。
エンコーダ・デコーダ・フレームワークをベースとして,ワードレベルとターンレベルの2つの注意レベルを計算する階層的複写手法を採用する。
フォーカス損失項は、最も情報性の高いターンに最も高いターンレベルの注意重みを割り当てるようモデルに促すために使用される。
- 参考スコア(独自算出の注目度): 19.86620340598476
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, researchers have explored using the encoder-decoder framework to
tackle dialogue state tracking (DST), which is a key component of task-oriented
dialogue systems. However, they regard a multi-turn dialogue as a flat
sequence, failing to focus on useful information when the sequence is long. In
this paper, we propose a Hierarchical Dynamic Copy Network (HDCN) to facilitate
focusing on the most informative turn, making it easier to extract slot values
from the dialogue context. Based on the encoder-decoder framework, we adopt a
hierarchical copy approach that calculates two levels of attention at the word-
and turn-level, which are then renormalized to obtain the final copy
distribution. A focus loss term is employed to encourage the model to assign
the highest turn-level attention weight to the most informative turn.
Experimental results show that our model achieves 46.76% joint accuracy on the
MultiWOZ 2.1 dataset.
- Abstract(参考訳): 近年,タスク指向対話システムの主要なコンポーネントである対話状態追跡(dst)に取り組むために,エンコーダ・デコーダフレームワークの利用が研究されている。
しかし、彼らはマルチターン対話をフラットなシーケンスとみなし、シーケンスが長い場合に有用な情報に集中できない。
本稿では,最も有益なターンに着目し,対話コンテキストからスロット値を抽出することを容易にする階層型動的コピーネットワーク(hdcn)を提案する。
エンコーダ・デコーダ・フレームワークに基づいて,ワード・ターンレベルで2つの注意レベルを計算し,最後にコピー分布を得るために再正規化する階層的コピー・アプローチを採用する。
フォーカス損失項は、最も情報性の高いターンに最も高いターンレベルの注意重みを割り当てるようモデルに促すために使用される。
実験の結果,MultiWOZ 2.1データセットでは46.76%のジョイント精度が得られた。
関連論文リスト
- Dialogue Ontology Relation Extraction via Constrained Chain-of-Thought Decoding [4.531390381842394]
本研究では,伝達学習における関係抽出に焦点をあてる。
我々は最近、推論問題のために開発されたChain-of-Thoughtデコーディングを生成的関係抽出に適用した。
論文 参考訳(メタデータ) (2024-08-05T10:10:01Z) - Uncovering Hidden Connections: Iterative Search and Reasoning for Video-grounded Dialog [83.63849872250651]
ビデオグラウンドダイアログは、正確な応答生成のために、ダイアログ履歴とビデオコンテンツの両方を深く理解する必要がある。
本稿では,テキストエンコーダ,ビジュアルエンコーダ,ジェネレータで構成される反復探索・推論フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-11T07:37:13Z) - A Unified Framework for Slot based Response Generation in a Multimodal
Dialogue System [25.17100881568308]
自然言語理解(NLU)と自然言語生成(NLG)は、すべての会話システムにおいて重要な要素である。
発話から必要なスロット値を抽出できるエンドツーエンドフレームワークを提案する。
事前学習したダイアロGPTを用いたマルチモーダル階層エンコーダを用いて、両方のタスクに対してより強力なコンテキストを提供する。
論文 参考訳(メタデータ) (2023-05-27T10:06:03Z) - Correlation Pyramid Network for 3D Single Object Tracking [16.694809791177263]
本稿では,統合エンコーダとモーションファクターデコーダを備えた新しい相関ピラミッドネットワーク(CorpNet)を提案する。
CorpNetは、リアルタイムに実行しながら最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-05-16T06:07:20Z) - Multi-grained Hypergraph Interest Modeling for Conversational
Recommendation [75.65483522949857]
複雑な履歴データの下でユーザの興味を捉えるために, マルチグラデーション・ハイパーグラフ・インフォメーション・モデリング手法を提案する。
提案手法では,まず,ユーザの過去の対話セッションをモデル化し,セッションベースハイパーグラフを作成するためにハイパーグラフ構造を用いる。
さらに,2種類のハイパーグラフに対して多粒度ハイパーグラフの畳み込みを行い,拡張表現を用いて関心を意識したCRSを開発する。
論文 参考訳(メタデータ) (2023-05-04T13:13:44Z) - Decoder-Only or Encoder-Decoder? Interpreting Language Model as a
Regularized Encoder-Decoder [75.03283861464365]
seq2seqタスクは、与えられた入力ソースシーケンスに基づいてターゲットシーケンスを生成することを目的としている。
伝統的に、seq2seqタスクのほとんどはエンコーダによって解決され、ソースシーケンスとデコーダをエンコードしてターゲットテキストを生成する。
最近、デコーダのみの言語モデルをseq2seqタスクに直接適用する、多くの新しいアプローチが出現しました。
論文 参考訳(メタデータ) (2023-04-08T15:44:29Z) - A Template-guided Hybrid Pointer Network for
Knowledge-basedTask-oriented Dialogue Systems [15.654119998970499]
本稿では,知識に基づくタスク指向対話システムのためのテンプレート誘導型ハイブリッドポインタネットワークを提案する。
本研究では,ゲーティング機構を備えたメモリポインタネットワークモデルを設計し,検索した回答と接地トラス応答とのセマンティックな相関関係をフル活用する。
論文 参考訳(メタデータ) (2021-06-10T15:49:26Z) - Discovering Dialog Structure Graph for Open-Domain Dialog Generation [51.29286279366361]
chitchat corporaの対話構造を無監督で発見します。
次に、下流システムでのダイアログ生成を容易にするために利用します。
本稿では,グラフニューラルネットワーク(DVAE-GNN)を用いた離散変分自動エンコーダを提案する。
論文 参考訳(メタデータ) (2020-12-31T10:58:37Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Rethinking and Improving Natural Language Generation with Layer-Wise
Multi-View Decoding [59.48857453699463]
シーケンシャル・ツー・シーケンス学習では、デコーダは注意機構に依存してエンコーダから情報を効率的に抽出する。
近年の研究では、異なるエンコーダ層からの表現を多様なレベルの情報に利用することが提案されている。
本稿では, 各デコーダ層に対して, グローバルビューとして機能する最後のエンコーダ層からの表現とともに, ソースシーケンスの立体視のために他のエンコーダ層からのデコーダ層からのデコーダ層を補足するレイヤワイド・マルチビューデコーダを提案する。
論文 参考訳(メタデータ) (2020-05-16T20:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。