論文の概要: With Argus Eyes: Assessing Retrieval Gaps via Uncertainty Scoring to Detect and Remedy Retrieval Blind Spots
- arxiv url: http://arxiv.org/abs/2602.09616v1
- Date: Tue, 10 Feb 2026 10:04:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.488058
- Title: With Argus Eyes: Assessing Retrieval Gaps via Uncertainty Scoring to Detect and Remedy Retrieval Blind Spots
- Title(参考訳): Argus Eyes:不確実なスコーリングによる検索失明の発見と治療
- Authors: Zeinab Sadat Taghavi, Ali Modarressi, Hinrich Schutze, Andreas Marfurt,
- Abstract要約: ニューラル検索には盲点があることを示し、クエリに関連するエンティティを検索できないが、クエリの埋め込みと類似性は低いと定義している。
我々は,このような盲点物質を埋め込み空間の到達不能な部分にマッピングする訓練によって引き起こされるバイアスについて検討した。
本稿では,高リスク(低RPS)エンティティの検索を可能にするパイプラインであるARGUSを紹介する。
- 参考スコア(独自算出の注目度): 10.538640148641532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable retrieval-augmented generation (RAG) systems depend fundamentally on the retriever's ability to find relevant information. We show that neural retrievers used in RAG systems have blind spots, which we define as the failure to retrieve entities that are relevant to the query, but have low similarity to the query embedding. We investigate the training-induced biases that cause such blind spot entities to be mapped to inaccessible parts of the embedding space, resulting in low retrievability. Using a large-scale dataset constructed from Wikidata relations and first paragraphs of Wikipedia, and our proposed Retrieval Probability Score (RPS), we show that blind spot risk in standard retrievers (e.g., CONTRIEVER, REASONIR) can be predicted pre-index from entity embedding geometry, avoiding expensive retrieval evaluations. To address these blind spots, we introduce ARGUS, a pipeline that enables the retrievability of high-risk (low-RPS) entities through targeted document augmentation from a knowledge base (KB), first paragraphs of Wikipedia, in our case. Extensive experiments on BRIGHT, IMPLIRET, and RAR-B show that ARGUS achieves consistent improvements across all evaluated retrievers (averaging +3.4 nDCG@5 and +4.5 nDCG@10 absolute points), with substantially larger gains in challenging subsets. These results establish that preemptively remedying blind spots is critical for building robust and trustworthy RAG systems (Code and Data).
- Abstract(参考訳): 信頼性の高い検索拡張生成(RAG)システムは、検索者の関連情報を見つける能力に大きく依存する。
RAGシステムで使用されるニューラルレトリバーには盲点があることを示し、クエリに関連するエンティティを検索できないが、クエリの埋め込みと類似性は低いと定義する。
我々は,このような盲点物質を埋め込み空間の到達不能な部分にマッピングする訓練によって引き起こされるバイアスについて検討した。
ウィキデータ関係とウィキペディアの第1段落から構築した大規模データセットと,提案した検索確率スコア(RPS)を用いて,標準レトリバー(例:ContriEVER,REASONIR)における盲点リスクを,エンティティ埋め込み幾何から事前に予測できることを示す。
これらの盲点に対処するため,我々は,知識ベース(KB)からの文書増補による高リスク(低RPS)エンティティの検索を可能にするパイプラインであるARGUSを紹介した。
BRIGHT, IMPLIRET, RAR-B の広範な実験により、ARGUS は全ての評価されたレトリバー(+3.4 nDCG@5 および +4.5 nDCG@10 絶対点)で一貫した改善を達成し、挑戦的な部分集合では大幅に向上した。
これらの結果は、堅牢で信頼性の高いRAGシステム(コードとデータ)を構築する上で、事前に盲点を修復することが重要であることを証明している。
関連論文リスト
- Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs [69.10441885629787]
Retrieval-Augmented Generation (RAG) は、外部知識を注入することによって、Large Language Models (LLM) の事実性を高める。
逆に、純粋に推論指向のアプローチは、しばしば幻覚的あるいは誤った事実を必要とする。
この調査は両鎖を統一的推論-検索の観点から合成する。
論文 参考訳(メタデータ) (2025-07-13T03:29:41Z) - Collapse of Dense Retrievers: Short, Early, and Literal Biases Outranking Factual Evidence [56.09494651178128]
検索モデルは、Retrieval-Augmented Generation (RAG)のような情報検索(IR)アプリケーションで一般的に使用される。
我々は、Dragon+やContrieverのようなリトリーバーに対する、短いドキュメントの好みなどのバイアスの影響を定量化する。
私たちは大きな脆弱性を発見し、リトリバーが短いドキュメント、早い位置、繰り返しのエンティティ、リテラルマッチを好んで、答えの存在を無視しながら表示します。
論文 参考訳(メタデータ) (2025-03-06T23:23:13Z) - Worse than Zero-shot? A Fact-Checking Dataset for Evaluating the Robustness of RAG Against Misleading Retrievals [5.605770511387228]
RAGuardは、不正検索に対するRAGシステムの堅牢性を評価する最初のベンチマークである。
合成ノイズに依存する以前のベンチマークとは異なり、ファクトチェックデータセットは自然に発生する誤報をキャプチャする。
論文 参考訳(メタデータ) (2025-02-22T05:50:15Z) - Corpus Poisoning via Approximate Greedy Gradient Descent [48.5847914481222]
本稿では,HotFlip法をベースとした高密度検索システムに対する新たな攻撃手法として,近似グレディ・グラディエント・Descentを提案する。
提案手法は,複数のデータセットと複数のレトリバーを用いて高い攻撃成功率を達成し,未知のクエリや新しいドメインに一般化可能であることを示す。
論文 参考訳(メタデータ) (2024-06-07T17:02:35Z) - RAGGED: Towards Informed Design of Scalable and Stable RAG Systems [51.171355532527365]
Retrieval-augmented Generation (RAG)は、外部知識を統合することで言語モデルを強化する。
RAGGEDは、RAGシステムを体系的に評価するためのフレームワークである。
論文 参考訳(メタデータ) (2024-03-14T02:26:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。