論文の概要: Can QPP Choose the Right Query Variant? Evaluating Query Variant Selection for RAG Pipelines
- arxiv url: http://arxiv.org/abs/2604.22661v1
- Date: Fri, 24 Apr 2026 15:36:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.522735
- Title: Can QPP Choose the Right Query Variant? Evaluating Query Variant Selection for RAG Pipelines
- Title(参考訳): QPPは正しいクエリ変数を選択することができるか? RAGパイプラインに対するクエリ変数の選択を評価する
- Authors: Negar Arabzadeh, Andrew Drozdov, Michael Bendersky, Matei Zaharia,
- Abstract要約: LLM(Large Language Models)は、現代の検索やRAG(Retrieval-Augmented Generation)パイプラインにおいて、クエリ再構成を至るところで実現している。
本稿では、アドホック検索とエンドツーエンドRAGをまたいで、クエリ性能予測(QPP)を異種選択のメカニズムとして検討する。
- 参考スコア(独自算出の注目度): 48.34524144147475
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have made query reformulation ubiquitous in modern retrieval and Retrieval-Augmented Generation (RAG) pipelines, enabling the generation of multiple semantically equivalent query variants. However, executing the full pipeline for every reformulation is computationally expensive, motivating selective execution: can we identify the best query variant before incurring downstream retrieval and generation costs? We investigate Query Performance Prediction (QPP) as a mechanism for variant selection across ad-hoc retrieval and end-to-end RAG. Unlike traditional QPP, which estimates query difficulty across topics, we study intra-topic discrimination - selecting the optimal reformulation among competing variants of the same information need. Through large-scale experiments on TREC-RAG using both sparse and dense retrievers, we evaluate pre- and post-retrieval predictors under correlation- and decision-based metrics. Our results reveal a systematic divergence between retrieval and generation objectives: variants that maximize ranking metrics such as nDCG often fail to produce the best generated answers, exposing a "utility gap" between retrieval relevance and generation fidelity. Nevertheless, QPP can reliably identify variants that improve end-to-end quality over the original query. Notably, lightweight pre-retrieval predictors frequently match or outperform more expensive post-retrieval methods, offering a latency-efficient approach to robust RAG.
- Abstract(参考訳): 大規模言語モデル(LLM)は、近代的な検索や検索-拡張生成(RAG)パイプラインにおいて、クエリ再構成を至るところで実現し、複数の意味論的に等価なクエリ変種の生成を可能にした。
しかし、全ての再構成のための完全なパイプラインの実行は計算コストが高く、選択的な実行を動機付けている:下流の検索と生成コストが発生する前に、最適なクエリ変種を特定できるだろうか?
本稿では、アドホック検索とエンドツーエンドRAGをまたいで、クエリ性能予測(QPP)を異種選択のメカニズムとして検討する。
トピック間のクエリの難易度を推定する従来のQPPとは異なり、同じ情報要求の競合する変種間の最適な修正を選択することによるトピック内識別について検討する。
スパース・リトリーバーと高密度レトリーバーの両方を用いたTREC-RAGの大規模実験を通じて,相関および決定に基づく指標の下で,事前および検索後の予測値を評価する。
この結果から,nDCGなどのランキング指標を最大化する変種は,検索妥当性と生成忠実度との間に「効用ギャップ」を露呈するなど,検索目標と生成目標の体系的な相違が明らかとなった。
それでもQPPは、元のクエリよりもエンドツーエンドの品質を向上させる変種を確実に識別することができる。
特に、軽量な検索前予測器は、より高価な検索後のメソッドとよく一致または性能が良く、堅牢なRAGに対するレイテンシ効率のよいアプローチを提供する。
関連論文リスト
- Hypothesis-Conditioned Query Rewriting for Decision-Useful Retrieval [39.146761527401424]
Retrieval-Augmented Generation (RAG)は、外部の非パラメトリック知識を基礎として、Large Language Models (LLM)を改善する。
既存のRAGメソッドは1つの初期クエリに依存しており、多くの場合、決定関連エビデンスよりもトピック的な関連性を好む。
本稿では,RAGをトピック指向検索からエビデンス指向検索へ再帰させる訓練不要な事前検索フレームワークであるHCQRを提案する。
論文 参考訳(メタデータ) (2026-03-19T15:15:58Z) - Investigating the Robustness of Retrieval-Augmented Generation at the Query Level [4.3028340012580975]
推論中に外部知識を動的に組み込むソリューションとして、検索拡張生成(RAG)が提案されている。
その約束にもかかわらず、RAGシステムは実際的な課題に直面し、特に、正確な検索のために入力クエリの品質に強く依存する。
論文 参考訳(メタデータ) (2025-07-09T15:39:17Z) - Chain-of-Retrieval Augmented Generation [91.02950964802454]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - Re-ranking the Context for Multimodal Retrieval Augmented Generation [28.63893944806149]
Retrieval-augmented Generation (RAG)は、文脈内で応答を生成するために外部知識を組み込むことで、大きな言語モデル(LLM)を強化する。
RAGシステムは固有の課題に直面している: (i) 検索プロセスはユーザクエリ(画像、文書など)への無関係なエントリを選択することができ、 (ii) 視覚言語モデルや GPT-4o のようなマルチモーダル言語モデルは、RAG出力を生成するためにこれらのエントリを処理する際に幻覚を与える。
より高度な関連性尺度を用いることで、知識ベースからより関連性の高い項目を選択して排除することにより、検索プロセスを強化することができることを示す。
論文 参考訳(メタデータ) (2025-01-08T18:58:22Z) - Probing-RAG: Self-Probing to Guide Language Models in Selective Document Retrieval [3.9639424852746274]
本稿では,言語モデルの中間層からの隠れ状態表現を利用して,与えられたクエリに対する追加検索の必要性を適応的に決定するProbing-RAGを提案する。
Probing-RAGはモデルの内部認識を効果的に捉え、外部文書の取得に関する信頼性の高い意思決定を可能にする。
論文 参考訳(メタデータ) (2024-10-17T08:48:54Z) - GenCRF: Generative Clustering and Reformulation Framework for Enhanced Intent-Driven Information Retrieval [20.807374287510623]
我々は,多種多様な意図を適応的に捉えるための生成クラスタリング・改革フレームワークGenCRFを提案する。
我々はGenCRFが,nDCG@10で従来のクエリ修正SOTAを最大12%上回り,最先端のパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2024-09-17T05:59:32Z) - Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.57065228857247]
Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。
本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。
オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文 参考訳(メタデータ) (2024-03-21T13:52:30Z) - LoL: A Comparative Regularization Loss over Query Reformulation Losses
for Pseudo-Relevance Feedback [70.44530794897861]
Pseudo-Relevance feedback (PRF) は、検索精度を向上させるための効果的なクエリ修正手法であることが証明されている。
既存のPRF手法は、同じクエリから派生した修正クエリを個別に扱うが、異なる数のフィードバックドキュメントを使用する。
そこで我々はLos-over-Loss(LoL)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-25T10:42:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。