論文の概要: BridgeRAG: Training-Free Bridge-Conditioned Retrieval for Multi-Hop Question Answering
- arxiv url: http://arxiv.org/abs/2604.03384v1
- Date: Fri, 03 Apr 2026 18:27:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.54683
- Title: BridgeRAG: Training-Free Bridge-Conditioned Retrieval for Multi-Hop Question Answering
- Title(参考訳): BridgeRAG:Multi-Hop Question Answeringのためのトレーニングフリーブリッジコンディション検索
- Authors: Andre Bacellar,
- Abstract要約: 本稿では,BridgeRAGを提案する。
BridgeRAGは、スコアリングからカバーを分離する: 二重エンタテイティーANNは、第2のホップ候補プールを広げる。
ブリッジコンディショニングが生産的再ランク付けを引き起こすことを示す(並列チェーンでは18.7%、単一チェーンでは0.6%)。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-hop retrieval is not a single-step relevance problem: later-hop evidence should be ranked by its utility conditioned on retrieved bridge evidence, not by similarity to the original query alone. We present BridgeRAG, a training-free, graph-free retrieval method for retrieval-augmented generation (RAG) over multi-hop questions that operationalizes this view with a tripartite scorer s(q,b,c) over (question, bridge, candidate). BridgeRAG separates coverage from scoring: dual-entity ANN expansion broadens the second-hop candidate pool, while a bridge-conditioned LLM judge identifies the active reasoning chain among competing candidates without any offline graph or proposition index. Across four controlled experiments we show that this conditioning signal is (i) selective: +2.55pp on parallel-chain queries (p<0.001) vs. ~0 on single-chain subtypes; (ii) irreplaceable: substituting the retrieved passage with generated SVO query text reduces R@5 by 2.1pp, performing worse than even the lowest-SVO-similarity pool passage; (iii) predictable: cos(b,g2) correlates with per-query gain (Spearman rho=0.104, p<0.001); and (iv) mechanistically precise: bridge conditioning causes productive re-rankings (18.7% flip-win rate on parallel-chain vs. 0.6% on single-chain), not merely more churn. Combined with lightweight coverage expansion and percentile-rank score fusion, BridgeRAG achieves the best published training-free R@5 under matched benchmark evaluation on all three standard MHQA benchmarks without a graph database or any training: 0.8146 on MuSiQue (+3.1pp vs. PropRAG, +6.8pp vs. HippoRAG2), 0.9527 on 2WikiMultiHopQA (+1.2pp vs. PropRAG), and 0.9875 on HotpotQA (+1.35pp vs. PropRAG).
- Abstract(参考訳): マルチホップ検索は、単一ステップの関連性の問題ではない: 後続ホップ証拠は、検索されたブリッジエビデンスに条件づけられた実用性によってランク付けされるべきであり、元のクエリのみと類似性によってランク付けされるべきである。
我々は、このビューを3部構成のスコアラーs(q,b,c)で操作するマルチホップ質問に対して、学習不要でグラフのない検索手法であるBridgeRAGを提案する。
デュアルエンタリティ ANN拡張は第2のホップ候補プールを広げる一方、ブリッジ条件のLCM判事は、オフライングラフや命題インデックスのない競合候補間のアクティブな推論チェーンを識別する。
4つの制御された実験で、この条件付け信号が示される。
(i)選択:+2.55pp on parallel-chain query (p<0.001) vs. ~0 on single-chain subtypes
(ii)置き換え不能:生成されたSVOクエリテキストで検索されたパスを置換すると、R@5が2.1pp減少し、最低のSVO類似プールパスよりもパフォーマンスが悪くなります。
(iii)予測可能:cos(b,g2)は、クエリ当たりのゲイン(Spearman rho=0.104, p<0.001);および
(4) 機械的正確性: ブリッジコンディショニングはパラレルチェーンでは18.7%のフリップウィンレート、シングルチェーンでは0.6%のフリップウィンレートを引き起こす。
軽量なカバレッジ拡張とパーセンタイル-ランクスコアの融合と組み合わせて、BridgeRAGは、グラフデータベースなしの3つの標準MHQAベンチマークと、いかなるトレーニングでも0.8146 on MuSiQue (+3.1pp vs. PropRAG, +6.8pp vs. HippoRAG2)、0.9527 on 2WikiMultiHopQA (+1.2pp vs. PropRAG)、0.9875 on HotpotQA (+1.35pp vs. PropRAG)という、マッチしたベンチマークで最高のトレーニングフリーのR@5を達成している。
関連論文リスト
- PAR$^2$-RAG: Planned Active Retrieval and Reasoning for Multi-Hop Question Answering [57.89576196160413]
大規模言語モデル (LLM) はマルチホップ質問応答 (MHQA) において脆弱のままである。
textbfPlanned Active Retrieval and Reasoning RAG (PAR$2-RAG)を提案する。
論文 参考訳(メタデータ) (2026-03-30T23:52:54Z) - Calibrated Fusion for Heterogeneous Graph-Vector Retrieval in Multi-Hop QA [0.0]
ベクトルとグラフのスコアを、融合前のパーセンタイルランク正規化(PIT)を用いて、共通の単位自由尺度にマップする。
MuSiQueと2WikiMultiHopQA全体で、キャリブレーションされた融合は最後のホップ検索を改善する。
論文 参考訳(メタデータ) (2026-03-30T18:13:01Z) - The Reasoning Bottleneck in Graph-RAG: Structured Prompting and Context Compression for Multi-Hop QA [4.190399245544758]
グラフRAGシステムは、文書を知識グラフにインデックス化することで、強力なマルチホップ質問応答を実現するが、強力な検索は強力な回答を保証しない。
検索された文脈では77%から91%の質問が金の答えを持っているが、精度は35%から78%に過ぎず、エラーの73%から84%が失敗の原因となっている。
i) SPARQLチェーン・オブ・シークレット・プロンプトは,質問をエンティティ・リレーショナル・コンテキストと整合したトリプル・パターンのクエリに分解し,(ii)グラフウォーク圧縮を行う。
論文 参考訳(メタデータ) (2026-03-14T17:29:13Z) - P-RAG: Prompt-Enhanced Parametric RAG with LoRA and Selective CoT for Biomedical and Multi-Hop QA [9.399056753263757]
Retrieval-Augmented Generation (RAG) は、推論中に外部知識を取得することで、この制約に対処する。
3種類のRAG変異体-Standard RAG, DA-RAG, 提案したPrompt-Enhanced Parametric RAG (P-RAG) について検討した。
P-RAG は LLM 内にパラメトリック知識を統合し、チェイン・オブ・ソート (CoT) の誘導とローランド適応 (LoRA) によって導かれる証拠を回収する。
論文 参考訳(メタデータ) (2026-02-02T03:42:45Z) - Generalized Parallel Scaling with Interdependent Generations [58.43994876504917]
本稿では,相互依存応答を並列に生成するブリッジを提案する。
少数の新しいパラメータしか持たず、ブリッジは強化学習による相対平均精度の向上を図っている。
論文 参考訳(メタデータ) (2025-10-01T17:33:35Z) - PropRAG: Guiding Retrieval with Beam Search over Proposition Paths [15.346744525284604]
PropRAGは、トリプルからコンテキストリッチな命題に移行する新しいRAGフレームワークである。
PropRAGは2Wiki、HotpotQA、MuSiQueでRecall@5とF1のスコアを達成している。
論文 参考訳(メタデータ) (2025-04-25T04:47:34Z) - Hydra-SGG: Hybrid Relation Assignment for One-stage Scene Graph Generation [57.69385990442078]
Hydra-SGGは、VG150 (16.0 mR@50)、Open Images V6 (50.1 weighted score)、GQA (12.7 mR@50)を含む複数のデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-09-16T13:13:06Z) - Faithful Chain-of-Thought Reasoning [51.21714389639417]
CoT(Chain-of-Thought)は言語モデル(LM)のパフォーマンスを様々な推論タスクで向上させる。
翻訳と問題解決という2つの段階を含む推論フレームワークであるFithful CoTを提案する。
このことは、推論連鎖が最終回答の忠実な説明を提供することを保証している。
論文 参考訳(メタデータ) (2023-01-31T03:04:26Z) - Adversarial Retriever-Ranker for dense text retrieval [51.87158529880056]
本稿では、二重エンコーダレトリバーとクロスエンコーダローダからなるAdversarial Retriever-Ranker(AR2)を提案する。
AR2は、既存の高密度レトリバー法より一貫して大幅に優れている。
これには、R@5から77.9%(+2.1%)、TriviaQA R@5から78.2%(+1.4)、MS-MARCO MRR@10から39.5%(+1.3%)の改善が含まれている。
論文 参考訳(メタデータ) (2021-10-07T16:41:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。