論文の概要: Segment-level Tree Search for Long Meeting Document Summarization
- arxiv url: http://arxiv.org/abs/2606.08445v1
- Date: Sun, 07 Jun 2026 04:21:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.110079
- Title: Segment-level Tree Search for Long Meeting Document Summarization
- Title(参考訳): 長期会議文書要約のためのセグメントレベル木探索
- Authors: Sangwon Ryu, Heejin Do, Jun Seo, Daehui Kim, Yunsu Kim, Gary Geunbae Lee, Jungseul Ok,
- Abstract要約: 我々は,モンテカルロ木探索(S3)によるセグメントレベルの要約を提案する。
S3は長い文書をセグメントに分割し、セグメントごとに複数の要約候補を生成し、探索木のノードを形成する。
7Bモデルを使っているにもかかわらず、S3は72Bモデルに匹敵する性能を達成し、長さに適した要約を生成する。
- 参考スコア(独自算出の注目度): 40.841609062628216
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Meeting documents are challenging to summarize due to their length and complex conversational structure. Existing approaches typically adopt multi-stage pipelines that extract information prior to summarization; however, these approaches often suffer from cumulative error propagation without intermediate validation, a limitation further amplified by short and low-quality reference summaries. We propose segment-level summarization via Monte Carlo Tree Search (S3), a training-free framework that constructs a final summary by composing segment-level summary candidates. S3 partitions a long document into segments and generates multiple summary candidates per segment, forming nodes of a search tree. The best-scoring combination is selected via self-reward-guided tree search and refined into the final output. Despite using a 7B model, S3 achieves performance comparable to larger 72B models while producing length-appropriate summaries.
- Abstract(参考訳): 会議文書の長さと複雑な会話構造のために要約することは困難である。
既存のアプローチでは、要約の前に情報を抽出する多段階パイプラインが一般的であるが、これらのアプローチは中間検証なしで累積誤差の伝播に悩まされることが多い。
そこで我々はモンテカルロ木探索(S3)によるセグメントレベルの要約を提案する。
S3は長い文書をセグメントに分割し、セグメントごとに複数の要約候補を生成し、探索木のノードを形成する。
ベストスコアの組み合わせは、自己回帰誘導木探索によって選択され、最終出力に洗練される。
7Bモデルを使っているにもかかわらず、S3は72Bモデルに匹敵する性能を達成し、長さに適した要約を生成する。
関連論文リスト
- DTCRS: Dynamic Tree Construction for Recursive Summarization [12.903751268469698]
DTCRSは文書構造とクエリセマンティクスに基づいて要約木を生成する手法である。
提案手法は, 概略木構築時間を大幅に短縮し, 3つのQAタスクにまたがる大幅な改善を実現する。
論文 参考訳(メタデータ) (2026-04-08T12:33:42Z) - Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.71038700559195]
The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。
SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文 参考訳(メタデータ) (2025-07-14T08:41:53Z) - Context-Aware Hierarchical Merging for Long Document Summarization [56.96619074316232]
本論文では,階層的なマージをソース文書からコンテキストと統合する手法を提案する。
法的および物語的領域を表すデータセットの実験結果は、文脈的拡張がゼロショットと階層的な融合ベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-02-03T01:14:31Z) - A Novel LLM-based Two-stage Summarization Approach for Long Dialogues [9.835499880812646]
本研究では,長い文書から情報を分割・凝縮する階層的枠組みを提案する。
凝縮段階は、教師なし生成モデルを用いて凝縮データを生成する。
要約段階は、縮合されたデータ上の抽象的な要約モデルを微調整して最終結果を生成する。
論文 参考訳(メタデータ) (2024-10-09T03:42:40Z) - Summarization Programs: Interpretable Abstractive Summarization with
Neural Modular Trees [89.60269205320431]
現在の抽象的要約モデルは明確な解釈可能性の欠如に悩まされるか、あるいは不完全理性を与える。
本稿では,バイナリツリーの(順序付き)リストからなる解釈可能なモジュラーフレームワークであるSummarization Program (SP)を提案する。
要約プログラムは、要約文毎に1つのルートノードを含み、各要約文と文書文を個別のツリーで接続する。
論文 参考訳(メタデータ) (2022-09-21T16:50:22Z) - On Generating Extended Summaries of Long Documents [16.149617108647707]
本稿では,長論文の拡張要約を生成する新しい手法を提案する。
本手法は,文書の階層構造を利用して抽出要約モデルに組み込む。
分析の結果,提案手法は,要約文に好適な抽出確率分布を調整できることが示唆された。
論文 参考訳(メタデータ) (2020-12-28T08:10:28Z) - Summarize, Outline, and Elaborate: Long-Text Generation via Hierarchical
Supervision from Extractive Summaries [46.183289748907804]
長文生成のためのアウトライン化,アウトライン化,エラボレートを行うパイプラインシステムSOEを提案する。
SOEは、より高速な収束速度とともに、非常に優れた品質の長いテキストを生成する。
論文 参考訳(メタデータ) (2020-10-14T13:22:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。