論文の概要: ThreadSumm: Summarization of Nested Discourse Threads Using Tree of Thoughts
- arxiv url: http://arxiv.org/abs/2604.17648v1
- Date: Sun, 19 Apr 2026 22:37:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.616646
- Title: ThreadSumm: Summarization of Nested Discourse Threads Using Tree of Thoughts
- Title(参考訳): ThreadSumm: 思考木を用いたNested Discourse Threadの要約
- Authors: Olubusayo Olabisi, Ekata Mitra, Ameeta Agrawal,
- Abstract要約: スレッド要約を階層的推論問題として扱う多段階LLMフレームワークであるThreadSummを紹介する。
提案手法はまず,LLMに基づく談話面抽出とアトミック・コンテント・ユニットによるコンテント・プランニングを行い,次にスレッド・アウェア・シーケンスの構築に文順を適用した。
これらの解釈可能なユニットに加えて、ThreadSummはTree of Thoughts検索を採用し、複数の段落候補を生成してスコア付けする。
- 参考スコア(独自算出の注目度): 3.3263205689999444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Summarizing deeply nested discussion threads requires handling interleaved replies, quotes, and overlapping topics, which standard LLM summarizers struggle to capture reliably. We introduce ThreadSumm, a multi-stage LLM framework that treats thread summarization as a hierarchical reasoning problem over explicit aspect and content unit representations. Our method first performs content planning via LLM-based extraction of discourse aspects and Atomic Content Units, then applies sentence ordering to construct thread-aware sequences that surface multiple viewpoints rather than a single linear strand. On top of these interpretable units, ThreadSumm employs a Tree of Thoughts search that generates and scores multiple paragraph candidates, jointly optimizing coherence and coverage within a unified search space. With this multi-proposal and iterative refinement design, we show improved performance in generating logically structured summaries compared to existing baselines, while achieving higher aspect retention and opinion coverage in nested discussions.
- Abstract(参考訳): 深くネストされた議論スレッドを要約するには、インターリーブされた回答、引用、重複するトピックを扱う必要がある。
本稿では,スレッド要約を明示的な側面やコンテンツ単位表現に対する階層的推論問題として扱う多段階LLMフレームワークThreadSummを紹介する。
提案手法はまず,LLMによる談話面抽出とアトミック・コンテント・ユニットによるコンテント・プランニングを行い,その上で,単一の線形ストランドではなく複数の視点を表わすスレッド・アウェア・シーケンスの構築を文順に行う。
これらの解釈可能なユニットに加えて、ThreadSummはTree of Thoughts検索を採用し、複数の段落候補を生成してスコア付けし、統一された検索空間内でコヒーレンスとカバレッジを共同最適化する。
この多元的かつ反復的な改良設計により,従来のベースラインと比較して論理的に構造化された要約の生成性能が向上し,また,ネストされた議論においてアスペクト保持と意見カバレッジの向上が達成された。
関連論文リスト
- Leveraging Large Language Models to Identify Conversation Threads in Collaborative Learning [14.255468784386977]
スレッディング(スレッディング)とは、会話が自然に、時間とともに進化する、織り交わされた話題のストランドに組織化される方法である。
本稿では,同期マルチパーティ・トランスクリプト中のスレッドを識別するための体系的なガイドブックを提供する。
次に、スレッディングが会話分析フレームワークの下流コーディングにどのように影響するかをテストする。
論文 参考訳(メタデータ) (2025-10-26T21:25:23Z) - Emulating Retrieval Augmented Generation via Prompt Engineering for Enhanced Long Context Comprehension in LLMs [23.960451986662996]
本稿では,レトリーバル拡張生成(RAG)を特殊エンジニアリングとチェーンオブ思考推論によりエミュレートする手法を提案する。
我々は,BABILong から選択したタスクに対するアプローチを評価し,大量の散逸テキストを用いた標準 bAbI QA 問題をインターリーブする。
論文 参考訳(メタデータ) (2025-02-18T02:49:40Z) - Context-Aware Hierarchical Merging for Long Document Summarization [56.96619074316232]
本論文では,階層的なマージをソース文書からコンテキストと統合する手法を提案する。
法的および物語的領域を表すデータセットの実験結果は、文脈的拡張がゼロショットと階層的な融合ベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-02-03T01:14:31Z) - DQFormer: Towards Unified LiDAR Panoptic Segmentation with Decoupled Queries [14.435906383301555]
本稿では,統合ワークフローにセマンティックとインスタンスセグメンテーションを実装するDQFormerという新しいフレームワークを提案する。
具体的には,セマンティクスを用いた情報的クエリを局所化して提案する,疎結合なクエリジェネレータを設計する。
また、クエリ指向マスクデコーダを導入し、対応するセグメンテーションマスクをデコードする。
論文 参考訳(メタデータ) (2024-08-28T14:14:33Z) - Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - Indicative Summarization of Long Discussions [37.80285705350554]
本稿では,大規模言語モデル (LLM) を用いた非教師なしの手法を提案する。
提案手法では、まず、引数文をクラスタ化し、抽象的な要約としてクラスタラベルを生成し、生成されたクラスタラベルを引数フレームに分類する。
広範に最適化されたプロンプトエンジニアリングアプローチに基づいて、生成クラスタラベリングとフレーム分類のための19LLMを評価する。
論文 参考訳(メタデータ) (2023-11-03T12:44:59Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z) - Summarize, Outline, and Elaborate: Long-Text Generation via Hierarchical
Supervision from Extractive Summaries [46.183289748907804]
長文生成のためのアウトライン化,アウトライン化,エラボレートを行うパイプラインシステムSOEを提案する。
SOEは、より高速な収束速度とともに、非常に優れた品質の長いテキストを生成する。
論文 参考訳(メタデータ) (2020-10-14T13:22:20Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。