論文の概要: DialoGen: Generalized Long-Range Context Representation for Dialogue
Systems
- arxiv url: http://arxiv.org/abs/2210.06282v4
- Date: Tue, 3 Oct 2023 05:17:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 10:57:54.652426
- Title: DialoGen: Generalized Long-Range Context Representation for Dialogue
Systems
- Title(参考訳): DialoGen:対話システムのための一般化ロングランジコンテキスト表現
- Authors: Suvodip Dey, Maunendra Sankar Desarkar, Asif Ekbal, P.K. Srijith
- Abstract要約: 一般化された文脈表現を持つ対話生成のための新しいフレームワークであるDialoGenを提案する。
提案手法が対話生成(オープンドメイン)と理解(DST)の両方に与える影響について検討する。
- 参考スコア(独自算出の注目度): 36.23733762476647
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long-range context modeling is crucial to both dialogue understanding and
generation. The most popular method for dialogue context representation is to
concatenate the last-$k$ utterances in chronological order. However, this
method may not be ideal for conversations containing long-range dependencies,
i.e., when there is a need to look beyond last-$k$ utterances to generate a
meaningful response. In this work, we propose DialoGen, a novel encoder-decoder
based framework for dialogue generation with a generalized context
representation that can look beyond the last-$k$ utterances. The main idea of
our approach is to identify and utilize the most relevant historical utterances
instead of last-$k$, which also enables the compact representation of dialogue
history with fewer tokens. We study the effectiveness of our proposed method on
both dialogue generation (open-domain) and understanding (DST). Even with a
compact context representation, DialoGen performs comparably to the
state-of-the-art models on the open-domain DailyDialog dataset. We observe a
similar behavior on the DST task of the MultiWOZ dataset when the proposed
context representation is applied to existing DST models. We also discuss the
generalizability and interpretability of DialoGen and show that the relevance
score of previous utterances agrees well with human cognition.
- Abstract(参考訳): 長距離コンテキストモデリングは対話理解と生成の両方に不可欠である。
対話コンテキスト表現の最も一般的な方法は、最後の$k$発話を時系列順に結合することである。
しかし、この方法は長い範囲の依存関係を含む会話には理想的ではないかもしれない。つまり、意味のある応答を生成するために最後の$k$の発話を超える必要がある場合である。
本稿では,対話生成のための新しいエンコーダ・デコーダベースのフレームワークであるdialogenを提案する。
提案手法の主な考え方は,より少ないトークンで対話履歴のコンパクトな表現を可能にするために,最後のk$ではなく,最も関連性の高い歴史的発話を識別・活用することである。
提案手法が対話生成(オープンドメイン)と理解(DST)の両方に与える影響について検討した。
コンパクトなコンテキスト表現であっても、DialoGenはオープンドメインのDailyDialogデータセットの最先端モデルと互換性がある。
提案手法が既存のDSTモデルに適用された場合,MultiWOZデータセットのDSTタスク上でも同様の挙動を示す。
また,対話の一般化可能性と解釈可能性について議論し,先行発話の関連性スコアが人間の認識とよく一致することを示す。
関連論文リスト
- Enhancing Visual Dialog State Tracking through Iterative Object-Entity Alignment in Multi-Round Conversations [3.784841749866846]
MDST(Multi-round Dialogue State Tracking Model)を導入する。
MDSTは、内的対話状態表現を視覚言語表現の2-タプルとして定義し、各ラウンドの対話履歴をキャプチャする。
VisDial v1.0データセットの実験結果は、MDSTが生成環境において新しい最先端性能を達成することを示した。
論文 参考訳(メタデータ) (2024-08-13T08:36:15Z) - Multi-grained Hypergraph Interest Modeling for Conversational
Recommendation [75.65483522949857]
複雑な履歴データの下でユーザの興味を捉えるために, マルチグラデーション・ハイパーグラフ・インフォメーション・モデリング手法を提案する。
提案手法では,まず,ユーザの過去の対話セッションをモデル化し,セッションベースハイパーグラフを作成するためにハイパーグラフ構造を用いる。
さらに,2種類のハイパーグラフに対して多粒度ハイパーグラフの畳み込みを行い,拡張表現を用いて関心を意識したCRSを開発する。
論文 参考訳(メタデータ) (2023-05-04T13:13:44Z) - Unsupervised Dialogue Topic Segmentation with Topic-aware Utterance
Representation [51.22712675266523]
対話トピック(DTS)は、様々な対話モデリングタスクにおいて重要な役割を果たす。
本稿では,ラベルなし対話データからトピック対応発話表現を学習する,教師なしDSSフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-04T11:35:23Z) - X-ReCoSa: Multi-Scale Context Aggregation For Multi-Turn Dialogue
Generation [0.0]
マルチターン対話生成では、応答は文脈の話題や背景だけでなく、文脈の文中の単語やフレーズにも関係している。
現在広く使われている階層型ダイアログモデルは、単語レベルのエンコーダから出力される文表現を無視して、発話レベルのエンコーダからの文脈表現のみに依存している。
本稿では,階層型ダイアログモデルのためのマルチスケールコンテキスト情報を集約する,新しいダイアログモデルX-ReCoSaを提案する。
論文 参考訳(メタデータ) (2023-03-14T12:15:52Z) - History-Aware Hierarchical Transformer for Multi-session Open-domain
Dialogue System [59.78425104243993]
マルチセッションオープンドメイン対話のための履歴認識階層変換器(HAHT)を提案する。
HAHTは歴史会話の長期記憶を維持し、歴史情報を利用して現在の会話状況を理解する。
大規模マルチセッション会話データセットの実験結果は,提案したHAHTモデルがベースラインモデルより一貫して優れていることを示唆している。
論文 参考訳(メタデータ) (2023-02-02T06:54:33Z) - Dialogue Meaning Representation for Task-Oriented Dialogue Systems [51.91615150842267]
タスク指向対話のための柔軟かつ容易に拡張可能な表現である対話意味表現(DMR)を提案する。
我々の表現は、合成意味論とタスク固有の概念のためのリッチな意味論を表現するために、継承階層を持つノードとエッジのセットを含んでいる。
異なる機械学習ベースの対話モデルを評価するための2つの評価タスクを提案し、さらにグラフベースのコア参照解決タスクのための新しいコア参照解決モデルGNNCorefを提案する。
論文 参考訳(メタデータ) (2022-04-23T04:17:55Z) - Precognition in Task-oriented Dialogue Understanding: Posterior
Regularization by Future Context [8.59600111891194]
本稿では,後続正則化手法を用いて,歴史的・将来の情報を共同でモデル化することを提案する。
これらの間のKL距離を最適化し、トレーニング中にモデルを正規化します。
2つの対話データセットの実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-03-07T09:58:50Z) - CREDIT: Coarse-to-Fine Sequence Generation for Dialogue State Tracking [44.38388988238695]
対話状態トラッカーは、現在の対話状態のコンパクトな表現を正確に見つけることを目的としている。
我々はシーケンス生成問題として構造化状態表現とキャスト対話状態追跡を用いる。
我々のトラッカーは,MultiWOZ 2.0とMultiWOZ 2.1データセットの5つの領域で共同目標精度を向上することを示した。
論文 参考訳(メタデータ) (2020-09-22T10:27:18Z) - Ranking Enhanced Dialogue Generation [77.8321855074999]
対話履歴を効果的に活用する方法は、マルチターン対話生成において重要な問題である。
これまでの研究は通常、歴史をモデル化するために様々なニューラルネットワークアーキテクチャを使用していた。
本稿では,ランキング拡張対話生成フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T01:49:56Z) - Modeling Long Context for Task-Oriented Dialogue State Generation [51.044300192906995]
本稿では,シンプルで効果的な発話タグ付け手法と双方向言語モデルを用いたマルチタスク学習モデルを提案する。
提案手法は,入力対話コンテキストシーケンスが長い場合に,ベースラインの性能が著しく低下する,という問題を解決する。
本実験では,MultiWOZ 2.0データセットにおいて,ベースラインに対して7.03%の相対的改善を実現し,新しい最先端のジョイントゴール精度を52.04%に設定した。
論文 参考訳(メタデータ) (2020-04-29T11:02:25Z) - Efficient Context and Schema Fusion Networks for Multi-Domain Dialogue
State Tracking [32.36259992245]
対話状態追跡(DST)は、前回の会話のすべてから現在の対話状態を推定することを目的としている。
マルチドメインDSTでは、状態候補の数の増加と対話長の増加により、データ空間の問題が大きな障害となっている。
従来の対話状態(予測)と現在の対話発話をDSTの入力として利用する。
論文 参考訳(メタデータ) (2020-04-07T13:46:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。