論文の概要: Rethinking Retrieval-Augmentation as Synthesis: A Query-Aware Context Merging Approach
- arxiv url: http://arxiv.org/abs/2603.20286v1
- Date: Wed, 18 Mar 2026 09:09:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.803066
- Title: Rethinking Retrieval-Augmentation as Synthesis: A Query-Aware Context Merging Approach
- Title(参考訳): Retrieval-Augmentationを合成として再考する:クエリ対応コンテキストマージアプローチ
- Authors: Jiarui Guo, Yuemeng Xu, Zongwei Lv, Yangyujia Wang, Xiaolin Wang, Kan Liu, Tao Lan, Lin Qu, Tong Yang,
- Abstract要約: Retrieval-Augmented Generation (RAG)により、LLM(Large Language Models)は、外部情報を動的に組み込んで既存の知識を拡張することができる。
標準的なパイプラインは、検索-then-select戦略を通じてこの問題に対処し、通常は関連性に基づいてトップkチャンクのみを保持する。
本稿では,静的フィルタリングからクエリ認識合成へパラダイムをシフトさせる新しいフレームワークであるMergeRAGを提案する。
- 参考スコア(独自算出の注目度): 8.202508647749125
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) enables Large Language Models (LLMs) to extend their existing knowledge by dynamically incorporating external information. However, practical deployment is fundamentally constrained by the LLM's finite context window, forcing a trade-off between information sufficiency and token consumption. Standard pipelines address this via a retrieve-then-select strategy, typically retaining only the top-k chunks based on relevance. Nevertheless, this approach is suboptimal: it inherently truncates critical bridging evidence located in the long tail of the relevance distribution, while simultaneously wasting the token budget on semantically redundant high-ranking chunks. In this paper, we rethink retrieval-augmentation as a dynamic optimization problem aimed at maximizing information density. We propose MergeRAG, a novel framework that shifts the paradigm from static filtering to query-aware synthesis. MergeRAG employs a scoring agent to restructure retrieved contexts through a dual-pathway mechanism: 1) Symmetric Merging, which consolidates weak signals to recover lost bridging evidence; 2) Asymmetric Merging, which utilizes entropy-guided anchoring to eliminate redundancy without sacrificing semantic integrity. We further introduce a Hierarchical Parallel Merging strategy that mitigates information loss while maximizing computational parallelism. Extensive experiments on standard benchmarks demonstrate that MergeRAG significantly outperforms state-of-the-art RAG baselines, achieving up to 13.7 points improvement in F1 score and 11.5 points in Exact Match (EM), respectively.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) により、Large Language Models (LLM) は、外部情報を動的に組み込んで既存の知識を拡張することができる。
しかし、実際的な展開は、LLMの有限コンテキストウィンドウによって基本的に制限されており、情報充足性とトークン消費との間のトレードオフを強制する。
標準的なパイプラインは、検索-then-select戦略を通じてこの問題に対処し、通常は関連性に基づいてトップkチャンクのみを保持する。
それにもかかわらず、このアプローチは準最適であり、本質的には関係分布の長い尾にある重要なブリッジの証拠を減らし、同時に意味的に冗長なハイグレードチャンクのトークン予算を浪費する。
本稿では,情報密度の最大化を目的とした動的最適化問題として,検索拡張を再考する。
本稿では,静的フィルタリングからクエリ認識合成へパラダイムをシフトさせる新しいフレームワークであるMergeRAGを提案する。
MergeRAGは、二重経路機構を通じて検索されたコンテキストを再構成するためにスコアリングエージェントを使用する。
1) 弱信号を統合して失われたブリッジの証拠を回収するシンメトリ・マージング
2) エントロピー誘導アンカーを用いて意味的整合性を犠牲にすることなく冗長性を解消する非対称マージング。
さらに,計算並列性を最大化しながら情報損失を軽減する階層型並列マージ戦略を導入する。
標準ベンチマークでの大規模な実験により、MergeRAGは最先端のRAGベースラインを著しく上回り、F1スコアで最大13.7ポイント、Exact Match (EM)で11.5ポイント向上した。
関連論文リスト
- OMG-Agent: Toward Robust Missing Modality Generation with Decoupled Coarse-to-Fine Agentic Workflows [9.617220633655716]
textbfunderlineOmni-textbfunderlineModality textbfunderlineGeneration Agent (textbfOMG-Agent)について述べる。
論文 参考訳(メタデータ) (2026-02-04T02:25:40Z) - Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation [12.71443292660797]
堅牢なRAGのためのコンテキスト認識トラバーサルであるCatRAGを提案する。
CatRAGはHippoRAG 2アーキテクチャ上に構築され、静的なKGをクエリ適応ナビゲーション構造に変換する。
4つのマルチホップベンチマークの実験では、CatRAGはアートベースラインの状態を一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-02T11:13:38Z) - SYNAPSE: Empowering LLM Agents with Episodic-Semantic Memory via Spreading Activation [29.545442480332515]
プリコンパイルされたリンクではなく静的を超越する統一メモリアーキテクチャであるSynapseを紹介する。
この結果から,Synapseは時間的およびマルチホップの複雑な推論タスクにおいて,最先端の手法を著しく上回ることがわかった。
私たちのコードとデータは受け入れ次第公開されます。
論文 参考訳(メタデータ) (2026-01-06T06:19:58Z) - SimpleMem: Efficient Lifelong Memory for LLM Agents [73.74399447715052]
セマンティックロスレス圧縮に基づく効率的なメモリフレームワークSimpleMemを紹介する。
本稿では,情報密度とトークン利用量の最大化を目的とした3段階パイプラインを提案する。
ベンチマークデータセットを用いた実験により,提案手法は精度,検索効率,推論コストにおいて,ベースラインアプローチを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2026-01-05T21:02:49Z) - Higress-RAG: A Holistic Optimization Framework for Enterprise Retrieval-Augmented Generation via Dual Hybrid Retrieval, Adaptive Routing, and CRAG [0.0]
Higress RAG MCP Serverは、AIデプロイメントのための、新しいエンタープライズ中心のアーキテクチャである。
システムは適応ルーティング、セマンティックキャッシュ、ハイブリッド検索、修正RAGを編成する。
Systemは、エンタープライズAIデプロイメントのためのスケーラブルで幻覚に強いソリューションを提供する。
論文 参考訳(メタデータ) (2025-12-30T05:28:05Z) - Unleashing Degradation-Carrying Features in Symmetric U-Net: Simpler and Stronger Baselines for All-in-One Image Restoration [52.82397287366076]
オールインワン画像復元は、統合された枠組み内で様々な劣化(ノイズ、ぼかし、悪天候など)を扱うことを目的としている。
本研究では, 優れた特徴抽出法により, 劣化伝達情報を本質的にエンコードする, 重要な知見を明らかにする。
我々の対称設計は固有の劣化信号を頑健に保存し、スキップ接続に単純な加法融合を施す。
論文 参考訳(メタデータ) (2025-12-11T12:20:31Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.10365329542365]
本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T06:59:17Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Reinforced Model Merging [53.84354455400038]
本稿では,タスク統合に適した環境とエージェントを含むRMM(Reinforced Model Merging)という,革新的なフレームワークを提案する。
評価プロセス中にデータサブセットを利用することで、報酬フィードバックフェーズのボトルネックに対処し、RMMを最大100倍高速化する。
論文 参考訳(メタデータ) (2025-03-27T08:52:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。