論文の概要: R$^3$AG: Retriever Routing for Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2604.22849v1
- Date: Wed, 22 Apr 2026 06:51:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:06.988593
- Title: R$^3$AG: Retriever Routing for Retrieval-Augmented Generation
- Title(参考訳): R$^3$AG:Retriever Routing for Retrieval-Augmented Generation
- Authors: Tong Zhao, Yutao Zhu, Yucheng Tian, Zhicheng Dou,
- Abstract要約: R$3$AGは、検索機能を2つの学習可能なディメンション、すなわち検索品質と生成ユーティリティに分解する。
R$3$AGは、最高の個々のレトリバーと最先端の静的ルーティングメソッドの両方を一貫して上回っている。
- 参考スコア(独自算出の注目度): 59.47703698994575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-augmented generation (RAG) has become a cornerstone for knowledge-intensive tasks. However, the efficacy of RAG is often bottlenecked by the ``one-size-fits-all'' retrieval paradigm, as different queries exhibit distinct preferences for different retrievers. While recent routing techniques attempt to select the optimal retriever dynamically, they typically operate under a ``single and static capability'' assumption, selecting retrievers solely based on semantic relevance. This overlooks a critical distinction in RAG: a retrieved document must not only be relevant but also effectively support the generator in producing correct answers. To address this limitation, we propose R$^3$AG, a novel routing framework that explicitly models the dynamic alignment between queries and retriever capabilities. Unlike previous approaches, R$^3$AG decomposes retriever capability into two learnable dimensions: retrieval quality and generation utility. We employ a contrastive learning objective that leverages complementary supervision signals, \textit{i.e.}, document assessments and downstream answer correctness, to capture query-specific preference shifts. Extensive experiments on several knowledge-intensive tasks show that R$^3$AG consistently outperforms both the best individual retrievers and state-of-the-art static routing methods.
- Abstract(参考訳): Retrieval-augmented Generation (RAG) は知識集約型タスクの基盤となっている。
しかしながら、RAGの有効性は'one-size-fits-all'検索パラダイムによってボトルネックとなることが多い。
最近のルーティング手法では、最適なレトリバーを動的に選択しようとするが、通常は'single and static capabilities'という仮定の下で動作し、セマンティックな関連性のみに基づいてレトリバーを選択する。
検索されたドキュメントは関連性があるだけでなく、正しい回答を生成する際にジェネレータを効果的にサポートしなければならない。
この制限に対処するため,クエリと検索機能の間の動的アライメントを明示的にモデル化する新しいルーティングフレームワークであるR$^3$AGを提案する。
従来のアプローチとは異なり、R$^3$AGは検索機能を2つの学習可能な次元(検索品質と生成ユーティリティ)に分解する。
我々は、補完的な監視信号である「textit{i.e.}」、文書評価、ダウンストリーム回答の正当性を活用して、クエリ固有の選好シフトをキャプチャする対照的な学習目標を用いる。
いくつかの知識集約的なタスクに対する大規模な実験により、R$^3$AGは、最高の個々のレトリバーと最先端の静的ルーティング手法の両方を一貫して上回っていることが示されている。
関連論文リスト
- Revisiting RAG Retrievers: An Information Theoretic Benchmark [10.168016086591452]
MIGRASCOPEは相互情報に基づくRAGレトリバー分析スコープである。
我々は、最先端のレトリバーを再検討し、情報と統計的推定理論に基づく原則付きメトリクスを導入する。
慎重に選択すれば、レトリバーのアンサンブルは、どのレトリバーよりも優れていることを示す。
論文 参考訳(メタデータ) (2026-02-25T04:19:06Z) - RVR: Retrieve-Verify-Retrieve for Comprehensive Question Answering [32.83942046822049]
retrieve-verify-retrieve (RVR)は、回答カバレッジを最大化するために設計されたマルチラウンド検索フレームワークである。
本研究は,検証手法を応用し,新たな推論シナリオに適応する,包括的回答リコールのための,有望な反復的アプローチを提案する。
論文 参考訳(メタデータ) (2026-02-20T18:48:05Z) - Reinforcement Fine-Tuning for History-Aware Dense Retriever in RAG [29.46121429194507]
Retrieval-augmented Generation (RAG) は、大規模言語モデルがエビデンスベースの応答を生成することを可能にする。
既存のソリューションは、レトリバー最適化とRAGパイプラインの目標との客観的なミスマッチに悩まされている。
論文 参考訳(メタデータ) (2026-02-03T15:30:14Z) - Agentic-R: Learning to Retrieve for Agentic Search [82.43426728778418]
エージェント検索に適した新しい検索学習フレームワークを提案する。
単一ターン検索拡張生成(RAG)用に設計された検索器とは違って,局所的なクエリ・パスの関連性とグローバルな回答の正当性を両立することを提案する。
我々のレトリバーは、我々のものとよばれ、異なる検索エージェント間で強いベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-01-17T02:59:54Z) - Decide Then Retrieve: A Training-Free Framework with Uncertainty-Guided Triggering and Dual-Path Retrieval [15.463220134915462]
本稿では,検索に必要なタイミングと外部情報の選択方法を適応的に決定する学習自由フレームワークを提案する。
5つのオープンドメインのQAベンチマーク、複数のモデルスケール、異なるレトリバーによる実験では、Decide Then Retrieveが標準RAGよりもEMとF1を一貫して改善していることが示されている。
論文 参考訳(メタデータ) (2026-01-07T13:20:59Z) - MARAG-R1: Beyond Single Retriever via Reinforcement-Learned Multi-Tool Agentic Retrieval [50.30107119622642]
大規模言語モデル(LLM)は推論と生成において優れているが、本質的には静的事前学習データによって制限されている。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識に基盤を置くことでこの問題に対処する。
MarAG-R1は、LLMが複数の検索機構を動的に調整できる強化学習型マルチツールRAGフレームワークである。
論文 参考訳(メタデータ) (2025-10-31T15:51:39Z) - SIRAG: Towards Stable and Interpretable RAG with A Process-Supervised Multi-Agent Framework [7.37561751991963]
本稿では,レシーバとジェネレータのギャップを埋めるプロセス管理型マルチエージェントフレームワークを提案する。
提案するフレームワークはモジュール式でプラグアンドプレイで、レトリバーやジェネレータを変更する必要はない。
論文 参考訳(メタデータ) (2025-09-17T09:09:28Z) - LTRR: Learning To Rank Retrievers for LLMs [53.285436927963865]
ルーティングベースのRAGシステムは、単一リトリバーベースのシステムよりも優れていることを示す。
パフォーマンス向上は、特にAnswer Correctness(AC)メトリックでトレーニングされたモデルで顕著である。
SIGIR 2025 LiveRAG チャレンジの一環として,提案システムを用いて提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-06-16T17:53:18Z) - ImpRAG: Retrieval-Augmented Generation with Implicit Queries [34.72864597562907]
ImpRAGは、検索と生成を統一モデルに統合するクエリフリーなRAGシステムである。
我々は、ImpRAGが、多様な形式を持つ未確認タスクの正確なマッチスコアを3.6-11.5改善したことを示す。
論文 参考訳(メタデータ) (2025-06-02T21:38:21Z) - EfficientRAG: Efficient Retriever for Multi-Hop Question Answering [52.64500643247252]
マルチホップ質問応答のための効率的な検索器であるEfficientRAGを紹介する。
実験の結果、EfficientRAGは3つのオープンドメインのマルチホップ質問応答データセット上で既存のRAG手法を超越していることがわかった。
論文 参考訳(メタデータ) (2024-08-08T06:57:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。