論文の概要: Multi-turn Dialogue Comprehension from a Topic-aware Perspective
- arxiv url: http://arxiv.org/abs/2309.09666v1
- Date: Mon, 18 Sep 2023 11:03:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 14:02:36.175075
- Title: Multi-turn Dialogue Comprehension from a Topic-aware Perspective
- Title(参考訳): 話題を意識したマルチターン対話理解
- Authors: Xinbei Ma, Yi Xu, Hai Zhao, Zhuosheng Zhang
- Abstract要約: 本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。
対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。
また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
- 参考スコア(独自算出の注目度): 70.37126956655985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dialogue related Machine Reading Comprehension requires language models to
effectively decouple and model multi-turn dialogue passages. As a dialogue
development goes after the intentions of participants, its topic may not keep
constant through the whole passage. Hence, it is non-trivial to detect and
leverage the topic shift in dialogue modeling. Topic modeling, although has
been widely studied in plain text, deserves far more utilization in dialogue
reading comprehension. This paper proposes to model multi-turn dialogues from a
topic-aware perspective. We start with a dialogue segmentation algorithm to
split a dialogue passage into topic-concentrated fragments in an unsupervised
way. Then we use these fragments as topic-aware language processing units in
further dialogue comprehension. On one hand, the split segments indict specific
topics rather than mixed intentions, thus showing convenient on in-domain topic
detection and location. For this task, we design a clustering system with a
self-training auto-encoder, and we build two constructed datasets for
evaluation. On the other hand, the split segments are an appropriate element of
multi-turn dialogue response selection. For this purpose, we further present a
novel model, Topic-Aware Dual-Attention Matching (TADAM) Network, which takes
topic segments as processing elements and matches response candidates with a
dual cross-attention. Empirical studies on three public benchmarks show great
improvements over baselines. Our work continues the previous studies on
document topic, and brings the dialogue modeling to a novel topic-aware
perspective with exhaustive experiments and analyses.
- Abstract(参考訳): 対話関連機械読解は、言語モデルに効果的に多重ターン対話の節を分離しモデル化することを要求する。
対話開発は参加者の意図に従って行われるため、その話題は一節を通して一定に保たれることはない。
したがって、対話モデリングにおいてトピックシフトを検出して活用するのは自明ではない。
トピックモデリングは、プレーンテキストで広く研究されているが、対話読解においてはるかに有効である。
本稿では,話題認識の観点から多段対話をモデル化する。
まず,対話文を,教師なしの方法でトピック中心の断片に分割する対話セグメンテーションアルゴリズムから始める。
次に、これらの断片を話題認識言語処理単位として、さらに対話理解を行う。
一方、分割セグメントは混合意図ではなく特定のトピックを予測し、ドメイン内のトピックの検出と位置に便利である。
本研究では,自己学習型オートエンコーダを用いたクラスタリングシステムを設計し,評価のために構築した2つのデータセットを構築する。
一方、分割セグメントはマルチターン対話応答選択の適切な要素である。
そこで本研究では,トピックセグメントを処理要素とし,応答候補と2重クロスアテンションをマッチングする,トピックアウェアな2重アテンションマッチング(tadam)ネットワークを提案する。
3つの公開ベンチマークに関する実証研究は、ベースラインよりも大きな改善を示している。
本研究は、文書トピックに関するこれまでの研究を継続し、対話モデリングを、徹底的な実験と分析を伴う新しいトピック認識視点にもたらした。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - With a Little Help from my (Linguistic) Friends: Topic Segmentation of
Multi-party Casual Conversations [0.565395466029518]
本稿では,最近の機械学習に基づくトピックセグメンテーションモデルと同等の精度を達成しようとする。
このタスクで意味のあるものとして認識する機能は、会話の話題構造をよりよく理解するのに役立ちます。
論文 参考訳(メタデータ) (2024-02-05T09:48:07Z) - Unsupervised Dialogue Topic Segmentation with Topic-aware Utterance
Representation [51.22712675266523]
対話トピック(DTS)は、様々な対話モデリングタスクにおいて重要な役割を果たす。
本稿では,ラベルなし対話データからトピック対応発話表現を学習する,教師なしDSSフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-04T11:35:23Z) - A Benchmark for Understanding and Generating Dialogue between Characters
in Stories [75.29466820496913]
本研究は,機械が物語の対話を理解・生成できるかどうかを探求する最初の研究である。
マスク付き対話生成と対話話者認識という2つの新しいタスクを提案する。
DialStoryの自動評価と手動評価で既存のモデルをテストすることで,提案課題の難しさを示す。
論文 参考訳(メタデータ) (2022-09-18T10:19:04Z) - Who says like a style of Vitamin: Towards Syntax-Aware
DialogueSummarization using Multi-task Learning [2.251583286448503]
個々の話者からの発声と独特の統語構造との関係に焦点をあてる。
話者は、音声プリントのような言語情報を含むことができる独自のテキストスタイルを持つ。
構文認識情報と対話要約の両方をマルチタスクで学習する。
論文 参考訳(メタデータ) (2021-09-29T05:30:39Z) - DialogLM: Pre-trained Model for Long Dialogue Understanding and
Summarization [19.918194137007653]
本稿では,長い対話理解と要約のための事前学習フレームワークを提案する。
長い会話の性質を考慮し、生成前学習のためのウィンドウベースの認知的アプローチを提案する。
我々は,対話要約,抽象的質問応答,トピックセグメンテーションのタスクをカバーする,長文対話の5つのデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-09-06T13:55:03Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。