論文の概要: Unsupervised Mutual Learning of Discourse Parsing and Topic Segmentation in Dialogue
- arxiv url: http://arxiv.org/abs/2405.19799v4
- Date: Mon, 24 Feb 2025 09:50:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:48:30.225516
- Title: Unsupervised Mutual Learning of Discourse Parsing and Topic Segmentation in Dialogue
- Title(参考訳): 対話における言論パーシングとトピックセグメンテーションの教師なし相互学習
- Authors: Jiahui Xu, Feng Jiang, Anningzhe Gao, Luis Fernando D'Haro, Haizhou Li,
- Abstract要約: 対話システムでは、会話の焦点の管理と対話のコーディネートにおいて、会話が重要な役割を果たす。
修辞的構造と主題的構造という2つの重要な構造から構成される。
我々は、修辞構造とトピック構造を統合する統一表現を導入し、それら間のセマンティック一貫性を確保する。
本稿では,レトリック構造とトピック構造を協調的にモデル化し,追加アノテーションを必要とせずに相互に強化できる教師なし相互学習フレームワーク(UMLF)を提案する。
- 参考スコア(独自算出の注目度): 37.618612723025784
- License:
- Abstract: In dialogue systems, discourse plays a crucial role in managing conversational focus and coordinating interactions. It consists of two key structures: rhetorical structure and topic structure. The former captures the logical flow of conversations, while the latter detects transitions between topics. Together, they improve the ability of a dialogue system to track conversation dynamics and generate contextually relevant high-quality responses. These structures are typically identified through discourse parsing and topic segmentation, respectively. However, existing supervised methods rely on costly manual annotations, while unsupervised methods often focus on a single task, overlooking the deep linguistic interplay between rhetorical and topic structures. To address these issues, we first introduce a unified representation that integrates rhetorical and topic structures, ensuring semantic consistency between them. Under the unified representation, we further propose two linguistically grounded hypotheses based on discourse theories: (1) Local Discourse Coupling, where rhetorical cues dynamically enhance topic-aware information flow, and (2) Global Topology Constraint, where topic structure patterns probabilistically constrain rhetorical relation distributions. Building on the unified representation and two hypotheses, we propose an unsupervised mutual learning framework (UMLF) that jointly models rhetorical and topic structures, allowing them to mutually reinforce each other without requiring additional annotations. We evaluate our approach on two rhetorical datasets and three topic segmentation datasets. Experimental results demonstrate that our method surpasses all strong baselines built on pre-trained language models. Furthermore, when applied to LLMs, our framework achieves notable improvements, demonstrating its effectiveness in improving discourse structure modeling.
- Abstract(参考訳): 対話システムでは、会話の焦点の管理と対話のコーディネートにおいて、会話が重要な役割を果たす。
修辞的構造と主題的構造という2つの重要な構造から構成される。
前者は会話の論理的流れを捉え、後者はトピック間の遷移を検出する。
会話のダイナミクスを追跡し、文脈的に関係のある高品質な応答を生成する対話システムの能力を向上させる。
これらの構造は典型的には、談話パーシングとトピックセグメンテーションによって識別される。
しかし、既存の教師付き手法は高価な手作業によるアノテーションに依存しており、教師なし手法は修辞学とトピック構造の間の深い言語的相互作用を見越して、1つのタスクにフォーカスすることが多い。
これらの問題に対処するために、まず、レトリックとトピック構造を統合する統一表現を導入し、それら間のセマンティック一貫性を確保する。
統一表現の下では, 談話理論に基づく2つの言語学的根拠に基づく仮説を提案する。(1) 局所談話結合, 修辞的手がかりが動的にトピック認識情報の流れを増強する,(2) トピック構造パターンが確率論的に修辞的関係分布を制約する, グローバルトポロジ制約。
統一表現と2つの仮説に基づいて,共同で修辞構造とトピック構造をモデル化し,追加アノテーションを必要とせずに相互に強化できる教師なし相互学習フレームワーク(UMLF)を提案する。
我々は2つの修辞的データセットと3つのトピックセグメンテーションデータセットに対するアプローチを評価する。
実験結果から,本手法は事前学習した言語モデル上に構築された強いベースラインを超越することが示された。
さらに, LLMに適用した場合, 本フレームワークは顕著な改善を実現し, 談話構造モデリングの改善に有効であることを示す。
関連論文リスト
- With a Little Help from my (Linguistic) Friends: Topic Segmentation of
Multi-party Casual Conversations [0.565395466029518]
本稿では,最近の機械学習に基づくトピックセグメンテーションモデルと同等の精度を達成しようとする。
このタスクで意味のあるものとして認識する機能は、会話の話題構造をよりよく理解するのに役立ちます。
論文 参考訳(メタデータ) (2024-02-05T09:48:07Z) - Multi-turn Dialogue Comprehension from a Topic-aware Perspective [70.37126956655985]
本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。
対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。
また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T11:03:55Z) - Revisiting Conversation Discourse for Dialogue Disentanglement [88.3386821205896]
本稿では,対話談話特性を最大限に活用し,対話の絡み合いを高めることを提案する。
我々は,会話の意味的文脈をより良くモデル化するために,リッチな構造的特徴を統合する構造認識フレームワークを開発した。
我々の研究は、より広範なマルチスレッド対話アプリケーションを促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-06-06T19:17:47Z) - Channel-aware Decoupling Network for Multi-turn Dialogue Comprehension [81.47133615169203]
本稿では,PrLMの逐次文脈化を超えて,発話間の包括的相互作用のための合成学習を提案する。
私たちは、モデルが対話ドメインに適応するのを助けるために、ドメイン適応型トレーニング戦略を採用しています。
実験の結果,提案手法は4つの公開ベンチマークデータセットにおいて,強力なPrLMベースラインを著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-01-10T13:18:25Z) - Speaker-Oriented Latent Structures for Dialogue-Based Relation
Extraction [10.381257436462116]
そこで我々は,話者指向の潜在構造を明瞭に誘導し,DiaREを改善する新しいモデルSOLSを提案する。
具体的には,発話境界を超えたトークン間の関係を捉えるために,潜在構造を学習する。
学習過程において、話者固有の正規化手法は、話者に関連するキーキーを徐々に強調し、無関係なキーを消去する。
論文 参考訳(メタデータ) (2021-09-11T04:24:51Z) - Exploring Discourse Structures for Argument Impact Classification [48.909640432326654]
本稿では、文脈経路に沿った2つの議論間の談話関係が、議論の説得力を特定する上で不可欠な要素であることを実証的に示す。
本研究では,文レベルの構造情報を大規模言語モデルから派生した文脈的特徴に注入・融合するDisCOCを提案する。
論文 参考訳(メタデータ) (2021-06-02T06:49:19Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z) - Structured Attention for Unsupervised Dialogue Structure Induction [110.12561786644122]
本稿では、構造化された注意層を離散潜在状態を持つ変化型リカレントニューラルネットワーク(VRNN)モデルに組み込んで、教師なしの方法で対話構造を学ぶことを提案する。
バニラVRNNと比較して、構造化された注意は、構造的帰納バイアスを強制しながら、ソース文の埋め込みの異なる部分にフォーカスすることができる。
論文 参考訳(メタデータ) (2020-09-17T23:07:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。