論文の概要: Query, Decompose, Compress: Structured Query Expansion for Efficient Multi-Hop Retrieval
- arxiv url: http://arxiv.org/abs/2603.21024v1
- Date: Wed, 14 Jan 2026 05:55:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:12.966044
- Title: Query, Decompose, Compress: Structured Query Expansion for Efficient Multi-Hop Retrieval
- Title(参考訳): Query, Decompose, Compress: 効率的なマルチホップ検索のための構造化クエリ拡張
- Authors: JungMin Yun, YoungBin Kim,
- Abstract要約: 大規模言語モデル(LLM)は、クエリ拡張にますます採用されている。
DeCoR(Decompose and Compress for Retrieval)は構造化情報処理を基盤としたフレームワークである。
- 参考スコア(独自算出の注目度): 19.37201042661162
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large Language Models (LLMs) have been increasingly employed for query expansion. However, their generative nature often undermines performance on complex multi-hop retrieval tasks by introducing irrelevant or noisy information. To address this challenge, we propose DeCoR (Decompose and Compress for Retrieval), a framework grounded in structured information refinement. Rather than generating additional content, DeCoR strategically restructures the query's underlying reasoning process and distills supporting evidence from retrieved documents. It consists of two core components tailored to the challenges of multi-hop retrieval: (1) Query Decomposition, which decomposes a complex query into explicit reasoning steps, and (2) Query-aware Document Compression, which synthesizes dispersed evidence from candidate documents into a concise summary relevant to the query. This structured design ensures that the final query representation remains both robust and comprehensive. Experimental results demonstrate that, despite utilizing a relatively small LLM, DeCoR outperforms strong baselines that rely on larger models. This finding underscores that, in complex retrieval scenarios, sophisticatedly leveraging the reasoning and summarization capabilities of LLMs offers a more efficient and effective solution than relying solely on their generative capability.
- Abstract(参考訳): 大規模言語モデル(LLM)は、クエリ拡張にますます採用されている。
しかし、その生成性は複雑なマルチホップ検索タスクの性能を損なうことがしばしばある。
この課題に対処するため,構造化情報処理を基盤としたフレームワークであるDeCoR(Decompose and Compress for Retrieval)を提案する。
追加のコンテンツを生成する代わりに、DeCoRはクエリの基本的な推論プロセスを戦略的に再構築し、取得した文書から証拠を抽出する。
1)複雑なクエリを明示的な推論ステップに分解するクエリ分解と,(2)候補文書から分散した証拠をクエリに関連する簡潔な要約に合成するクエリ認識ドキュメンテーション圧縮である。
この構造化された設計は、最終的なクエリ表現が堅牢かつ包括的であることを保証する。
実験結果から、比較的小さなLLMを応用したにもかかわらず、DeCoRはより大きなモデルに依存する強いベースラインよりも優れていることが示された。
この発見は、複雑な検索シナリオにおいて、LLMの推論と要約能力を巧みに活用することで、生成能力にのみ依存するよりも、より効率的で効果的なソリューションを提供することを示す。
関連論文リスト
- Multi-Step Semantic Reasoning in Generative Retrieval [50.65947993017158]
生成検索(GR)モデルは、モデルパラメータ内のコーパスを符号化し、所定のクエリに対して関連するドキュメント識別子を生成する。
既存のGRモデルは、財務報告に対するセマンティック推論など、数値的な文脈で複雑なクエリに苦しむ。
GR内の数値文脈における多段階意味推論を強化するためのフレームワークであるReasonGRを提案する。
論文 参考訳(メタデータ) (2026-03-12T18:38:50Z) - ROG: Retrieval-Augmented LLM Reasoning for Complex First-Order Queries over Knowledge Graphs [14.25887925588904]
本稿では,クエリを意識した近傍検索と大規模言語モデル(LLM)の連鎖推論を組み合わせた検索拡張フレームワークを提案する。
ROGはマルチ演算クエリを単一演算サブクエリのシーケンスに分解する。
中間回答セットはステップ間でキャッシュされ再利用され、深い推論チェーンの一貫性が向上します。
論文 参考訳(メタデータ) (2026-02-02T17:45:43Z) - A Large Language Model Based Method for Complex Logical Reasoning over Knowledge Graphs [16.929901817693334]
知識グラフ(KG)と一階述語論理(FOL)クエリを関連付けることは、現実世界のKGが本質的に不完全であるために困難である。
本稿では,問合せ対応のKG近傍検索と大規模言語モデル(LLM)に基づくチェーン・オブ・シークレット推論を組み合わせたアンサンブルスタイルのフレームワークであるROGを提案する。
論文 参考訳(メタデータ) (2025-12-22T07:01:05Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.71038700559195]
The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。
SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文 参考訳(メタデータ) (2025-07-14T08:41:53Z) - MultiConIR: Towards multi-condition Information Retrieval [38.864056667809095]
MultiConIRは、複雑なマルチ条件クエリシナリオ下での検索および再ランクモデルの評価のために設計されたベンチマークである。
ほとんどのレトリバーとリランカは、クエリの複雑さが増大するにつれて、パフォーマンスが大幅に低下する。
この研究は、リランカの性能劣化の原因を解明し、クエリ内の条件位置が類似性評価にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2025-03-11T05:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。