論文の概要: CATCH: A Controllable Theme Detection Framework with Contextualized Clustering and Hierarchical Generation
- arxiv url: http://arxiv.org/abs/2512.21715v1
- Date: Thu, 25 Dec 2025 15:33:25 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:56:23.793499
- Title: CATCH: A Controllable Theme Detection Framework with Contextualized Clustering and Hierarchical Generation
- Title(参考訳): CATCH:コンテキストクラスタリングと階層生成を備えた制御可能なテーマ検出フレームワーク
- Authors: Rui Ke, Jiahui Xu, Shenghao Yang, Kuang Wang, Feng Jiang, Haizhou Li,
- Abstract要約: 本稿では,コンテキスト認識型トピック表現,優先誘導型トピッククラスタリング,階層型テーマ生成機構という,3つのコアコンポーネントを統合した統合フレームワークを提案する。
マルチドメイン顧客対話ベンチマーク(DSTC-12)の実験は、テーマクラスタリングとトピック生成品質の両方において、8B LLMを用いたCATCHの有効性を示す。
- 参考スコア(独自算出の注目度): 33.065240934374586
- License:
- Abstract: Theme detection is a fundamental task in user-centric dialogue systems, aiming to identify the latent topic of each utterance without relying on predefined schemas. Unlike intent induction, which operates within fixed label spaces, theme detection requires cross-dialogue consistency and alignment with personalized user preferences, posing significant challenges. Existing methods often struggle with sparse, short utterances for accurate topic representation and fail to capture user-level thematic preferences across dialogues. To address these challenges, we propose CATCH (Controllable Theme Detection with Contextualized Clustering and Hierarchical Generation), a unified framework that integrates three core components: (1) context-aware topic representation, which enriches utterance-level semantics using surrounding topic segments; (2) preference-guided topic clustering, which jointly models semantic proximity and personalized feedback to align themes across dialogue; and (3) a hierarchical theme generation mechanism designed to suppress noise and produce robust, coherent topic labels. Experiments on a multi-domain customer dialogue benchmark (DSTC-12) demonstrate the effectiveness of CATCH with 8B LLM in both theme clustering and topic generation quality.
- Abstract(参考訳): テーマ検出はユーザ中心の対話システムの基本課題であり、事前定義されたスキーマに頼ることなく、各発話の潜在トピックを特定することを目的としている。
固定ラベル空間内で機能するインテントインジェクションとは異なり、テーマ検出にはクロスダイアログの一貫性とパーソナライズされたユーザの好みとの整合が必要であり、重大な課題を呈している。
既存の手法は、正確な話題表現のためのスパースで短い発話に苦しむことが多く、対話間のユーザレベルの主題的嗜好を捉えない。
これらの課題に対処するため,CATCH (Controllable Theme Detection with Contextualized Clustering and Hierarchical Generation) という3つのコアコンポーネントを統合した統合フレームワークを提案する。(1) 発話レベルのセマンティクスを周囲のトピックセグメントで強化するコンテキスト対応トピック表現,(2) セマンティックな近接性とパーソナライズされたフィードバックを共同でモデル化し,対話間でテーマの整合を図った好み誘導トピッククラスタリング,(3) ノイズを抑え,一貫性のあるトピックラベルを生成するための階層的テーマ生成機構である。
マルチドメイン顧客対話ベンチマーク(DSTC-12)の実験は、テーマクラスタリングとトピック生成品質の両方において、8B LLMを用いたCATCHの有効性を示す。
関連論文リスト
- Controllable Conversational Theme Detection Track at DSTC 12 [24.160077192565087]
本稿では,会話分析における重要な課題として,テーマ検出を導入する。
従来の対話意図の検出とは異なり、テーマは会話の中核的な質問の直接的でユーザ向きの要約として意図されている。
ダイアログ・システム・テクノロジー・チャレンジ12(Dialog System Technology Challenge 12)において,パブリック・コンペティション・トラックとして制御可能な会話テーマ検出問題を提起した。
論文 参考訳(メタデータ) (2025-08-26T08:10:01Z) - Unsupervised Mutual Learning of Discourse Parsing and Topic Segmentation in Dialogue [37.618612723025784]
対話システムでは、会話の焦点の管理と対話のコーディネートにおいて、会話が重要な役割を果たす。
修辞的構造と主題的構造という2つの重要な構造から構成される。
我々は、修辞構造とトピック構造を統合する統一表現を導入し、それら間のセマンティック一貫性を確保する。
本稿では,レトリック構造とトピック構造を協調的にモデル化し,追加アノテーションを必要とせずに相互に強化できる教師なし相互学習フレームワーク(UMLF)を提案する。
論文 参考訳(メタデータ) (2024-05-30T08:10:50Z) - Multi-turn Dialogue Comprehension from a Topic-aware Perspective [70.37126956655985]
本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。
対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。
また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T11:03:55Z) - Revisiting Conversation Discourse for Dialogue Disentanglement [88.3386821205896]
本稿では,対話談話特性を最大限に活用し,対話の絡み合いを高めることを提案する。
我々は,会話の意味的文脈をより良くモデル化するために,リッチな構造的特徴を統合する構造認識フレームワークを開発した。
我々の研究は、より広範なマルチスレッド対話アプリケーションを促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-06-06T19:17:47Z) - Unsupervised Dialogue Topic Segmentation with Topic-aware Utterance
Representation [51.22712675266523]
対話トピック(DTS)は、様々な対話モデリングタスクにおいて重要な役割を果たす。
本稿では,ラベルなし対話データからトピック対応発話表現を学習する,教師なしDSSフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-04T11:35:23Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z) - Detecting and Classifying Malevolent Dialogue Responses: Taxonomy, Data
and Methodology [68.8836704199096]
コーパスベースの会話インタフェースは、テンプレートベースのエージェントや検索ベースのエージェントよりも多様な自然なレスポンスを生成することができる。
コーパスベースの会話エージェントの生成能力が増大すると、マレヴォレントな反応を分類し、フィルタリングする必要性が生じる。
不適切な内容の認識と分類に関するこれまでの研究は、主にある種のマレヴォレンスに焦点を絞っている。
論文 参考訳(メタデータ) (2020-08-21T22:43:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。