論文の概要: Unsupervised Mutual Learning of Discourse Parsing and Topic Segmentation in Dialogue
- arxiv url: http://arxiv.org/abs/2405.19799v3
- Date: Mon, 17 Feb 2025 09:22:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:05:34.032811
- Title: Unsupervised Mutual Learning of Discourse Parsing and Topic Segmentation in Dialogue
- Title(参考訳): 対話における言論パーシングとトピックセグメンテーションの教師なし相互学習
- Authors: Jiahui Xu, Feng Jiang, Anningzhe Gao, Luis Fernando D'Haro, Haizhou Li,
- Abstract要約: 対話システムでは、会話の焦点の管理と対話のコーディネートにおいて、会話が重要な役割を果たす。
修辞的構造と主題的構造という2つの重要な構造から構成される。
我々は、修辞構造とトピック構造を統合する統一表現を導入し、それら間のセマンティック一貫性を確保する。
本稿では,レトリック構造とトピック構造を協調的にモデル化し,追加アノテーションを必要とせずに相互に強化できる教師なし相互学習フレームワーク(UMLF)を提案する。
- 参考スコア(独自算出の注目度): 37.618612723025784
- License:
- Abstract: In dialogue systems, discourse plays a crucial role in managing conversational focus and coordinating interactions. It consists of two key structures: rhetorical structure and topic structure. The former captures the logical flow of conversations, while the latter detects transitions between topics. Together, they improve the ability of a dialogue system to track conversation dynamics and generate contextually relevant high-quality responses. These structures are typically identified through discourse parsing and topic segmentation, respectively. However, existing supervised methods rely on costly manual annotations, while unsupervised methods often focus on a single task, overlooking the deep linguistic interplay between rhetorical and topic structures. To address these issues, we first introduce a unified representation that integrates rhetorical and topic structures, ensuring semantic consistency between them. Under the unified representation, we further propose two linguistically grounded hypotheses based on discourse theories: (1) Local Discourse Coupling, where rhetorical cues dynamically enhance topic-aware information flow, and (2) Global Topology Constraint, where topic structure patterns probabilistically constrain rhetorical relation distributions. Building on the unified representation and two hypotheses, we propose an unsupervised mutual learning framework (UMLF) that jointly models rhetorical and topic structures, allowing them to mutually reinforce each other without requiring additional annotations. We evaluate our approach on two rhetorical datasets and three topic segmentation datasets. Experimental results demonstrate that our method surpasses all strong baselines built on pre-trained language models. Furthermore, when applied to LLMs, our framework achieves notable improvements, demonstrating its effectiveness in improving discourse structure modeling.
- Abstract(参考訳): 対話システムでは、会話の焦点の管理と対話のコーディネートにおいて、会話が重要な役割を果たす。
修辞的構造と主題的構造という2つの重要な構造から構成される。
前者は会話の論理的流れを捉え、後者はトピック間の遷移を検出する。
会話のダイナミクスを追跡し、文脈的に関係のある高品質な応答を生成する対話システムの能力を向上させる。
これらの構造は典型的には、談話パーシングとトピックセグメンテーションによって識別される。
しかし、既存の教師付き手法は高価な手作業によるアノテーションに依存しており、教師なし手法は修辞学とトピック構造の間の深い言語的相互作用を見越して、1つのタスクにフォーカスすることが多い。
これらの問題に対処するために、まず、レトリックとトピック構造を統合する統一表現を導入し、それら間のセマンティック一貫性を確保する。
統一表現の下では, 談話理論に基づく2つの言語学的根拠に基づく仮説を提案する。(1) 局所談話結合, 修辞的手がかりが動的にトピック認識情報の流れを増強する,(2) トピック構造パターンが確率論的に修辞的関係分布を制約する, グローバルトポロジ制約。
統一表現と2つの仮説に基づいて,共同で修辞構造とトピック構造をモデル化し,追加アノテーションを必要とせずに相互に強化できる教師なし相互学習フレームワーク(UMLF)を提案する。
我々は2つの修辞的データセットと3つのトピックセグメンテーションデータセットに対するアプローチを評価する。
実験結果から,本手法は事前学習した言語モデル上に構築された強いベースラインを超越することが示された。
さらに, LLMに適用した場合, 本フレームワークは顕著な改善を実現し, 談話構造モデリングの改善に有効であることを示す。
関連論文リスト
- Multi-turn Dialogue Comprehension from a Topic-aware Perspective [70.37126956655985]
本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。
対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。
また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T11:03:55Z) - Revisiting Conversation Discourse for Dialogue Disentanglement [88.3386821205896]
本稿では,対話談話特性を最大限に活用し,対話の絡み合いを高めることを提案する。
我々は,会話の意味的文脈をより良くモデル化するために,リッチな構造的特徴を統合する構造認識フレームワークを開発した。
我々の研究は、より広範なマルチスレッド対話アプリケーションを促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-06-06T19:17:47Z) - CTRLStruct: Dialogue Structure Learning for Open-Domain Response
Generation [38.60073402817218]
十分に構造化されたトピックフローは、バックグラウンド情報を活用し、将来のトピックを予測することで、制御可能で説明可能な応答を生成する。
本稿では,話題レベルの対話クラスタを効果的に探索する対話構造学習のための新しいフレームワークを提案する。
2つの人気のあるオープンドメイン対話データセットの実験は、優れた対話モデルと比較して、我々のモデルはより一貫性のある応答を生成できることを示している。
論文 参考訳(メタデータ) (2023-03-02T09:27:11Z) - Unsupervised Learning of Hierarchical Conversation Structure [50.29889385593043]
ゴール指向の会話は、しばしば意味のあるサブ対話構造を持つが、ドメインに依存しやすい。
この研究は、ターンやサブダイアログのセグメントラベルを含む階層的な会話構造を学習するための教師なしのアプローチを導入する。
復号化構造は3つの会話レベル理解タスクのための言語ニューラルネットワークの強化に有用であることが示されている。
論文 参考訳(メタデータ) (2022-05-24T17:52:34Z) - Structure Extraction in Task-Oriented Dialogues with Slot Clustering [94.27806592467537]
タスク指向対話では、対話構造はしばしば対話状態間の遷移グラフと見なされている。
本稿では,タスク指向対話における構造抽出のための簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T20:18:12Z) - GraphDialog: Integrating Graph Knowledge into End-to-End Task-Oriented
Dialogue Systems [9.560436630775762]
エンドツーエンドのタスク指向対話システムは,平易なテキスト入力から直接システム応答を生成することを目的としている。
1つは、外部知識ベース(KB)を学習フレームワークに効果的に組み込む方法であり、もう1つは、対話履歴のセマンティクスを正確に捉える方法である。
この2つの課題は、知識ベースと対話の依存性解析ツリーにおけるグラフ構造情報を活用することで解決される。
論文 参考訳(メタデータ) (2020-10-04T00:04:40Z) - Structured Attention for Unsupervised Dialogue Structure Induction [110.12561786644122]
本稿では、構造化された注意層を離散潜在状態を持つ変化型リカレントニューラルネットワーク(VRNN)モデルに組み込んで、教師なしの方法で対話構造を学ぶことを提案する。
バニラVRNNと比較して、構造化された注意は、構造的帰納バイアスを強制しながら、ソース文の埋め込みの異なる部分にフォーカスすることができる。
論文 参考訳(メタデータ) (2020-09-17T23:07:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。