論文の概要: RASER: Recoverability-Aware Selective Escalation Router for Multi-Hop Question Answering
- arxiv url: http://arxiv.org/abs/2606.02488v1
- Date: Mon, 01 Jun 2026 16:59:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.519222
- Title: RASER: Recoverability-Aware Selective Escalation Router for Multi-Hop Question Answering
- Title(参考訳): RASER:マルチホップ質問応答のためのリカバリ性を考慮した選択的エスカレーションルータ
- Authors: Yuyang Li, Zihe Yan, Tobias Käfer,
- Abstract要約: マルチホップ質問応答システムは、質問ごとに高価な検索を使用することが多い。
マルチホップ質問の多くは、一発のRAGですでに正しく答えられている。
ワンショットRAG上に構築された安価なルータ群であるRASERとその6つの機能を紹介する。
- 参考スコア(独自算出の注目度): 2.8761106301503356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-hop question-answering systems often use expensive retrieval on every question. They may decompose the question, run several retrieval rounds, or search through bridge entities before answering. All of these strategies rely on repeated LLM calls to rewrite or decompose the question, which increases extra token cost, and it is not fitting when the LLM budget is tight. However, our analysis shows that lots of multi-hop questions are already answered correctly by a single one-shot RAG, so running an extra retrieval on every question wastes the budget. We introduce RASER (Recoverability-Aware Selective Escalation Router), a family of cheap routers built on one-shot RAG and six features from it. RASER-2 decides whether to stop or escalate to the extra-retrieval action PRUNE. RASER-3 chooses among one-shot RAG, PRUNE, and iterative retrieval IRCoT, using the same features but adding an explicit cost-accuracy trade-off. Neither router makes an extra LLM call to decide. Across six LLMs and three multi-hop QA benchmarks, both routers stay competitive with the other state-of-the-art (SOTA) baselines in F1 while spending only 41-49% of always-prune's tokens and also less than the iterative and decomposition retrieval baselines.
- Abstract(参考訳): マルチホップ質問応答システムは、質問ごとに高価な検索を使用することが多い。
質問を分解したり、いくつかの検索ラウンドを実行したり、回答する前にブリッジエンティティを検索したりすることができる。
これらの戦略はすべて LLM の繰り返しの呼び出しに頼り、問題を書き換えたり分解したりすることでトークンのコストを増大させ、LCM の予算が厳格であれば不適切である。
しかし、分析の結果、マルチホップの質問の多くは、1発のRAGですでに正しく答えられているため、全ての質問に対して余分な検索を行うことは予算を浪費することがわかった。
本稿では,RASER(Recoverability-Aware Selective Escalation Router)を紹介する。
RASER-2はPRUNEを停止するか、エスカレートするかを決定する。
RASER-3は、同じ機能を使用して一発のRAG、PRUNE、反復検索IRCoTを選択し、明示的なコスト精度トレードオフを追加した。
どちらのルータも、決める余分なLCMコールをしない。
6つのLLMと3つのマルチホップQAベンチマークで、両ルータはF1の他の最先端(SOTA)ベースラインと競合する一方で、常に規則のトークンの41-49%と反復的および分解的検索ベースラインよりも少ない。
関連論文リスト
- CompactRAG: Reducing LLM Calls and Token Overhead in Multi-Hop Question Answering [15.281365738928415]
既存のマルチホップRAGシステムは、各ステップで検索と推論を交互に行う。
オンライン推論からオフラインコーパス再構成を分離するフレームワークであるCompactRAGを提案する。
HotpotQA, 2WikiMultiHopQA, MuSiQue の実験では, CompactRAG がトークン消費を大幅に削減し,競争精度を向上することを示した。
論文 参考訳(メタデータ) (2026-02-05T14:52:06Z) - PRISM: Agentic Retrieval with LLMs for Multi-Hop Question Answering [10.971852280240357]
本稿では,大規模言語モデル(LLM)を構造化ループで活用し,高い精度で関連する証拠を検索するエージェント検索システムを提案する。
我々のフレームワークは3つの専門的なエージェントで構成されている: マルチホップ質問をサブクエストに分解する質問アナライザ、サブクエスト毎に最も関連性の高いコンテキストを特定するセレクタ、そして、欠けている証拠をもたらすアダである。
論文 参考訳(メタデータ) (2025-10-16T04:02:29Z) - Evaluating Retrieval-Augmented Generation Systems on Unanswerable, Uncheatable, Realistic, Multi-hop Queries [53.99620546358492]
実世界のユースケースでは、複雑なクエリを持つRAGシステムが存在し、関連する情報がコーパスから欠落したり、不完全であったりすることが多い。
既存のRAGベンチマークは、マルチホップやスコープ外の質問に対して、現実的なタスクの複雑さを反映することはめったにない。
un$underlinec$heatable, $underliner$ealistic, $underlineu$nanswerable, $underlinem$ulti-hopの自動生成のための最初のパイプラインを提示する。
論文 参考訳(メタデータ) (2025-10-13T21:38:04Z) - Transforming Questions and Documents for Semantically Aligned Retrieval-Augmented Generation [1.223779595809275]
マルチホップ質問応答に適した新しい検索拡張世代(RAG)フレームワークを提案する。
本システムは,大規模言語モデル(LLM)を用いて,複雑なマルチホップ質問を文書検索を導く単一ホップ要求列に分解する。
生文書やチャンクを直接埋め込む代わりに、Qwen3-8Bを使って各文書チャンクから回答可能な質問を生成し、これらの生成された質問を埋め込んで、質問-問合せの類似性を通じて関連チャンクを検索する。
論文 参考訳(メタデータ) (2025-08-13T12:35:04Z) - RCR-Router: Efficient Role-Aware Context Routing for Multi-Agent LLM Systems with Structured Memory [57.449129198822476]
RCRは、マルチエージェント大言語モデル(LLM)システムのためのロールアウェアコンテキストルーティングフレームワークである。
役割とタスクステージに基づいて、各エージェントに対して意味的に関連するメモリサブセットを動的に選択する。
軽量スコアリングポリシは、メモリ選択をガイドし、エージェント出力を共有メモリストアに統合する。
論文 参考訳(メタデータ) (2025-08-06T21:59:34Z) - EfficientRAG: Efficient Retriever for Multi-Hop Question Answering [52.64500643247252]
マルチホップ質問応答のための効率的な検索器であるEfficientRAGを紹介する。
実験の結果、EfficientRAGは3つのオープンドメインのマルチホップ質問応答データセット上で既存のRAG手法を超越していることがわかった。
論文 参考訳(メタデータ) (2024-08-08T06:57:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。