論文の概要: Not All Queries Need Rewriting: When Prompt-Only LLM Refinement Helps and Hurts Dense Retrieval
- arxiv url: http://arxiv.org/abs/2603.13301v1
- Date: Mon, 02 Mar 2026 10:40:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.282887
- Title: Not All Queries Need Rewriting: When Prompt-Only LLM Refinement Helps and Hurts Dense Retrieval
- Title(参考訳): すべてのクエリが書き換える必要は無い: Prompt-Only LLMのリファインメントが役に立ち、検索が困難になる
- Authors: Varun Kotte,
- Abstract要約: 最適化された垂直領域では,プロンプトのみの書き換えが有害であることを示す。
我々は一貫したメカニズムを同定する: 語彙のアライメントを減らした項を共起的に書き換える。
ドメイン適応的なポストトレーニングは、監督や暗黙のフィードバックが利用可能であれば、より安全な戦略であると提案する。
- 参考スコア(独自算出の注目度): 0.11280931253550518
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prompt-only, single-step LLM query rewriting, where a rewrite is generated from the query alone without retrieval feedback, is commonly used in production RAG pipelines, but its effect on dense retrieval is poorly understood. We present a systematic empirical study across three BEIR benchmarks, two dense retrievers, and multiple training configurations, and find strongly domain-dependent behavior: rewriting degrades nDCG@10 by 9.0 percent on FiQA, improves it by 5.1 percent on TREC-COVID, and has no significant effect on SciFact. We identify a consistent mechanism: degradations co-occur with reduced lexical alignment between rewritten queries and relevant documents, as rewriting replaces domain-specific terms in already well-matched queries. In contrast, improvements arise when rewriting shifts queries toward corpus-preferred terminology and resolves inconsistent nomenclature. Lexical substitution occurs in 95 percent of rewrites across all outcome groups, showing that effectiveness depends on the direction of substitution rather than substitution itself. We also study selective rewriting and find that simple feature-based gating can reduce worst-case regressions but does not reliably outperform never rewriting, with even oracle selection offering only modest gains. Overall, these results show that prompt-only rewriting can be harmful in well-optimized verticals and suggest that domain-adaptive post-training is a safer strategy when supervision or implicit feedback is available.
- Abstract(参考訳): 検索フィードバックなしでのみクエリから書き直しが生成されるプロンプトのみの単一ステップのLCMクエリ書き換えは、RAGパイプラインで一般的に使用されるが、その高密度検索への影響はよく理解されていない。
我々は,3つのBEIRベンチマーク,2つの高密度レトリバー,複数のトレーニング構成にまたがる系統的実証的研究を行い,ドメインに依存した振る舞いを強く見出した。
書き直されたクエリと関連するドキュメント間の語彙的アライメントを減らした分解は、すでに整合したクエリでドメイン固有の用語を置き換えるため、一貫したメカニズムを識別する。
対照的に、リライトがクエリをコーパス優先の用語にシフトし、一貫性のない命名を解消するときに改善が生じる。
語彙置換はすべての結果群の書き直しの95%で起こり、効果は置換自体よりも置換の方向に依存する。
また、選択的な書き直しについても検討し、単純な機能ベースのゲーティングは最悪のレグレッションを低減できるが、決して書き直しを確実に上回るものではないことを発見した。
全体として、これらの結果は、適切に最適化された分野において、プロンプトのみの書き換えが有害であることを示し、ドメイン適応的なポストトレーニングが、監督や暗黙のフィードバックが利用可能である場合に、より安全な戦略であることを示唆している。
関連論文リスト
- Test-Time Strategies for More Efficient and Accurate Agentic RAG [58.44913384057518]
Retrieval-Augmented Generation (RAG) システムは複雑なマルチホップ問題に直面している。
このような手法は、以前に処理された情報の反復的な検索を含む非効率性を導入することができる。
本稿では,これらの問題を軽減するために,サーチ-R1パイプラインに対するテスト時間修正について検討する。
論文 参考訳(メタデータ) (2026-03-12T19:18:59Z) - Improving Neural Retrieval with Attribution-Guided Query Rewriting [3.1153758106426603]
明確でないクエリやあいまいなクエリは、関係するドキュメントが存在する場合でも、ランク付けを誤って行うことができる。
本稿では,トークンレベルの説明を用いた帰属誘導型クエリ書き換え手法を提案する。
結果の書き直しは、強いベースライン上での検索効率を一貫して改善する。
論文 参考訳(メタデータ) (2026-02-12T11:34:06Z) - Relevance to Utility: Process-Supervised Rewrite for RAG [38.81331265140413]
モジュールが真のドキュメントユーティリティをキャプチャできないことを示す。
本稿では,正しい解を生成する確率を最大化するために,直接最適化する鍵となる特徴を持つR2Uを提案する。
論文 参考訳(メタデータ) (2025-09-19T04:24:57Z) - QueryBandits for Hallucination Mitigation: Exploiting Semantic Features for No-Regret Rewriting [27.117502300924183]
報酬モデルを最大化するために書き直し戦略を設計するフレームワークであるQueryBanditsを紹介します。
我々は,クエリ書き換えの形式を取り入れた介入を通じて幻覚を緩和するためのQueryBanditsの有効性を実証的に裏付ける。
論文 参考訳(メタデータ) (2025-08-22T01:41:49Z) - Gumbel Reranking: Differentiable End-to-End Reranker Optimization [61.16471123356738]
RAGシステムは関連する文書を識別するためにリランカーに依存している。
注釈付きクエリ-ドキュメントペアが不足しているため、これらのモデルの微調整は依然として難しい。
我々は,トレーニングと推論のギャップを最小限に抑えることを目的とした,リランカーのためのエンドツーエンドのトレーニングフレームワークであるGumbel Re rankを提案する。
論文 参考訳(メタデータ) (2025-02-16T13:23:39Z) - Adaptive Query Rewriting: Aligning Rewriters through Marginal Probability of Conversational Answers [66.55612528039894]
AdaQRは、シードデータセットからの限定的な書き直しアノテーションと完全にパスラベルのないクエリ書き換えモデルをトレーニングするフレームワークである。
会話クエリに条件付き回答の確率を用いて,これらの候補に対する検索者の嗜好を評価する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-16T16:09:05Z) - Generative Query Reformulation Using Ensemble Prompting, Document Fusion, and Relevance Feedback [8.661419320202787]
GenQREnsembleとGenQRFusionはゼロショット命令のパラフレーズを利用して複数のキーワードセットを生成し、検索性能を向上させる。
検索前設定ではnDCG@10で最大18%,検索後設定では9%の精度で検索効率を向上できることを示す。
論文 参考訳(メタデータ) (2024-05-27T21:03:26Z) - RaFe: Ranking Feedback Improves Query Rewriting for RAG [83.24385658573198]
アノテーションを使わずにクエリ書き換えモデルをトレーニングするためのフレームワークを提案する。
公開されているリランカを活用することで、フィードバックはリライトの目的とよく一致します。
論文 参考訳(メタデータ) (2024-05-23T11:00:19Z) - LoL: A Comparative Regularization Loss over Query Reformulation Losses
for Pseudo-Relevance Feedback [70.44530794897861]
Pseudo-Relevance feedback (PRF) は、検索精度を向上させるための効果的なクエリ修正手法であることが証明されている。
既存のPRF手法は、同じクエリから派生した修正クエリを個別に扱うが、異なる数のフィードバックドキュメントを使用する。
そこで我々はLos-over-Loss(LoL)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-25T10:42:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。