論文の概要: NeocorRAG: Less Irrelevant Information, More Explicit Evidence, and More Effective Recall via Evidence Chains
- arxiv url: http://arxiv.org/abs/2604.27852v1
- Date: Thu, 30 Apr 2026 13:37:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.112637
- Title: NeocorRAG: Less Irrelevant Information, More Explicit Evidence, and More Effective Recall via Evidence Chains
- Title(参考訳): NeocorRAG:無関係な情報、より明確なエビデンス、エビデンスチェーンによるより効果的なリコール
- Authors: Shiyao Peng, Qianhe Zheng, Zhuodi Hao, Zichen Tang, Rongjin Li, Qing Huang, Jiayu Huang, Jiacheng Liu, Yifan Zhu, Haihong E,
- Abstract要約: Retrieval-Augmented Generation (RAG)の改善は、下流の推論において、常に相反する利得に変換されない。
本稿では,リコール変換率(Recall Conversion Rate, RCR)を提案する。
我々は,Evidence Chainsを体系的にマイニングし,活用することにより,総合的な検索品質の最適化を実現するNeocorRAGフレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.980207267884674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although precise recall is a core objective in Retrieval-Augmented Generation (RAG), a critical oversight persists in the field: improvements in retrieval performance do not consistently translate to commensurate gains in downstream reasoning. To diagnose this gap, we propose the Recall Conversion Rate (RCR), a novel evaluation metric to quantify the contribution of retrieval to reasoning accuracy. Our quantitative analysis of mainstream RAG methods reveals that as Recall@5 improves, the RCR exhibits a near-linear decay. We identify the neglect of retrieval quality in these methods as the underlying cause. In contrast, approaches that focus solely on quality optimization often suffer from inferior recall performance. Both categories lack a comprehensive understanding of retrieval quality optimization, resulting in a trade-off dilemma. To address these challenges, we propose comprehensive retrieval quality optimization criteria and introduce the NeocorRAG framework. This framework achieves holistic retrieval quality optimization by systematically mining and utilizing Evidence Chains. Specifically, NeocorRAG first employs an innovative activated search algorithm to obtain a refined candidate space. Then it ensures precise evidence chain generation through constrained decoding. Finally, the retrieved set of evidence chains guides the retrieval optimization process. Evaluated on benchmarks including HotpotQA, 2WikiMultiHopQA, MuSiQue, and NQ, NeocorRAG achieves SOTA performance on both 3B and 70B parameter models, while consuming less than 20% of tokens used by comparable methods. This study presents an efficient, training-free paradigm for RAG enhancement that effectively optimizes retrieval quality while maintaining high recall. Our code is released at https://github.com/BUPT-Reasoning-Lab/NeocorRAG.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) における正確なリコールは中核的な目的であるが、重要な監視はこの分野に留まっている。
このギャップを診断するために,検索と推論の精度を定量化する新しい評価指標であるリコール変換率(Recall Conversion Rate, RCR)を提案する。
主流RAG法を定量的に分析したところ、Recall@5が改良されるにつれて、RCRはほぼ直線的な崩壊を示すことがわかった。
これらの手法における検索品質の欠如を根本原因とみなす。
対照的に、品質最適化にのみ焦点をあてるアプローチは、しばしばリコール性能が劣る。
どちらのカテゴリも、検索品質の最適化に関する包括的な理解が欠けているため、トレードオフジレンマが発生する。
これらの課題に対処するため、我々は総合的な検索品質最適化基準を提案し、NeocorRAGフレームワークを導入した。
このフレームワークは,エビデンス・チェーンを体系的にマイニングし,活用することにより,総合的な検索品質の最適化を実現する。
具体的には、NeocorRAGはまず革新的活性化探索アルゴリズムを用いて、洗練された候補空間を得る。
そして、制約付き復号による正確なエビデンスチェーン生成を保証する。
最後に、得られたエビデンスチェーンの集合が、検索最適化プロセスのガイドとなる。
HotpotQA, 2WikiMultiHopQA, MuSiQue, NQ などのベンチマークで評価すると,NeocorRAG は 3B と 70B のパラメータモデルで SOTA のパフォーマンスを達成し,同等のメソッドで使用されるトークンの20%未満を消費する。
本研究では,高いリコールを維持しつつ,検索品質を効果的に最適化するRAG強化のための,効率的かつトレーニング不要なパラダイムを提案する。
私たちのコードはhttps://github.com/BUPT-Reasoning-Lab/NeocorRAGで公開されています。
関連論文リスト
- Reproducing Adaptive Reranking for Reasoning-Intensive IR [21.517949407443453]
グラフベースのアダプティブリカウンドアドレスは、リカウンドプロセス自体を変更することで、バウンドリコールの問題に対処する。
GARは、様々なモデルにわたる推論集約的な検索の有効性を高める。
この作業により、推論集約的なクエリに対処可能な、より実用的な検索システムのデプロイが可能になる。
論文 参考訳(メタデータ) (2026-04-30T08:30:09Z) - Cycle-Consistent Search: Question Reconstructability as a Proxy Reward for Search Agent Training [80.20022221643414]
Cycle-Consistent Searchは、検索エージェントを訓練するための金色のスーパービジョンのないフレームワークである。
CCSは教師付きベースラインに匹敵する性能を示す。
これらの結果から,CCSは金の監督が不可能な環境で検索エージェントを訓練するためのスケーラブルな訓練パラダイムを提供する可能性が示唆された。
論文 参考訳(メタデータ) (2026-04-14T17:00:18Z) - Reinforced Informativeness Optimization for Long-Form Retrieval-Augmented Generation [77.10390725623125]
LFQA(Long-form Question answering)は、大規模言語モデルに固有の課題を提示する。
RioRAGは、強化情報性最適化を通じて長めのRAGを進化させる新しい強化学習フレームワークである。
論文 参考訳(メタデータ) (2025-05-27T07:34:41Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Chain-of-Retrieval Augmented Generation [91.02950964802454]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。