論文の概要: DTCRS: Dynamic Tree Construction for Recursive Summarization
- arxiv url: http://arxiv.org/abs/2604.07012v1
- Date: Wed, 08 Apr 2026 12:33:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.518472
- Title: DTCRS: Dynamic Tree Construction for Recursive Summarization
- Title(参考訳): DTCRS:再帰的な要約のための動的木構築
- Authors: Guanran Luo, Zhongquan Jian, Wentao Qiu, Meihong Wang, Qingqiang Wu,
- Abstract要約: DTCRSは文書構造とクエリセマンティクスに基づいて要約木を生成する手法である。
提案手法は, 概略木構築時間を大幅に短縮し, 3つのQAタスクにまたがる大幅な改善を実現する。
- 参考スコア(独自算出の注目度): 12.903751268469698
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) mitigates the hallucination problem of Large Language Models (LLMs) by incorporating external knowledge. Recursive summarization constructs a hierarchical summary tree by clustering text chunks, integrating information from multiple parts of a document to provide evidence for abstractive questions involving multi-step reasoning. However, summary trees often contain a large number of redundant summary nodes, which not only increase construction time but may also negatively impact question answering. Moreover, recursive summarization is not suitable for all types of questions. We introduce DTCRS, a method that dynamically generates summary trees based on document structure and query semantics. DTCRS determines whether a summary tree is necessary by analyzing the question type. It then decomposes the question and uses the embeddings of sub-questions as initial cluster centers, reducing redundant summaries while improving the relevance between summaries and the question. Our approach significantly reduces summary tree construction time and achieves substantial improvements across three QA tasks. Additionally, we investigate the applicability of recursive summarization to different question types, providing valuable insights for future research.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の幻覚問題を、外部知識を取り入れることで緩和する。
再帰的要約は、テキストチャンクをクラスタリングして階層的な要約木を構築し、文書の複数の部分からの情報を統合し、多段階推論を含む抽象的な質問の証拠を提供する。
しかし、サマリツリーには多くの冗長なサマリノードが含まれており、これは建設時間を増加させるだけでなく、質問応答に悪影響を及ぼす可能性がある。
さらに、再帰的な要約はあらゆる種類の質問に適していない。
本稿では,文書構造とクエリセマンティクスに基づく要約木を動的に生成する手法であるDTCRSを紹介する。
DTCRSは質問タイプを分析して要約木が必要かどうかを決定する。
その後、疑問を分解し、サブクエストの埋め込みを初期クラスタセンターとして使用し、冗長なサマリーを削減し、サマリーとイシューの関係を改善した。
提案手法は, 概略木構築時間を大幅に短縮し, 3つのQAタスクにまたがる大幅な改善を実現する。
さらに,様々な質問タイプに対する再帰的要約の適用性について検討し,今後の研究に有用な知見を提供する。
関連論文リスト
- MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries [2.756584457554517]
Map-Disambiguate-Enrich-Reduce (MDER)はコンテキスト由来の3重記述を生成し、エンティティレベルの要約と統合する。
Decompose-Resolve (DR)は、ユーザクエリを解決可能なトリプルに分解し、知識グラフに格納する。
MDERとDRはLLM駆動のQAパイプラインを形成し、スパース、不完全、複雑なリレーショナルデータに対して堅牢である。
論文 参考訳(メタデータ) (2026-03-11T18:38:44Z) - TaSR-RAG: Taxonomy-guided Structured Reasoning for Retrieval-Augmented Generation [17.21708416305234]
textscTaSR-RAGは、エビデンス選択のための分類誘導構造推論フレームワークである。
textscTaSR-RAGは、強いRAGと構造化RAGベースラインを最大14%上回っている。
論文 参考訳(メタデータ) (2026-03-10T08:16:36Z) - Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.71038700559195]
The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。
SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文 参考訳(メタデータ) (2025-07-14T08:41:53Z) - TreeRare: Syntax Tree-Guided Retrieval and Reasoning for Knowledge-Intensive Question Answering [10.597526246308938]
反復的かつ適応的な検索は、複雑で知識集約的な質問を解決するための有望なアプローチであることが示されている。
本研究では,構文木を利用した質問応答のための情報検索と推論のためのフレームワークであるTreeRareを提案する。
TreeRareは、既存の最先端メソッドよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-05-31T01:07:50Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - Context-Aware Hierarchical Merging for Long Document Summarization [56.96619074316232]
本論文では,階層的なマージをソース文書からコンテキストと統合する手法を提案する。
法的および物語的領域を表すデータセットの実験結果は、文脈的拡張がゼロショットと階層的な融合ベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-02-03T01:14:31Z) - RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval [26.527911244587134]
本稿では,テキストの集合体への埋め込み,クラスタリング,要約という新たなアプローチを導入し,下から異なるレベルの要約レベルを持つ木を構築する。
我々のRAPTORモデルは、推測時にこの木から取得し、異なるレベルの抽象化で長いドキュメントにまたがる情報を統合します。
論文 参考訳(メタデータ) (2024-01-31T18:30:21Z) - HIBRIDS: Attention with Hierarchical Biases for Structure-aware Long
Document Summarization [17.58231642569116]
注意点の計算に文書構造を取り入れた階層的バイアスフォアを注入するHIBRIDSを提案する。
また、ソース文書中の有能な内容を質問階層と要約階層に要約するための新しいタスクである階層的質問要約生成を提案する。
論文 参考訳(メタデータ) (2022-03-21T05:27:35Z) - Abstractive Query Focused Summarization with Query-Free Resources [60.468323530248945]
本稿では,汎用的な要約リソースのみを利用して抽象的なqfsシステムを構築する問題を考える。
本稿では,要約とクエリのための新しい統一表現からなるMasked ROUGE回帰フレームワークであるMargeを提案する。
最小限の監視から学習したにもかかわらず,遠隔管理環境において最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-12-29T14:39:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。