論文の概要: BiRD: A Bidirectional Ranking Defense Mechanism for Retrieval Augmented Generation
- arxiv url: http://arxiv.org/abs/2605.20123v1
- Date: Tue, 19 May 2026 17:11:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.548147
- Title: BiRD: A Bidirectional Ranking Defense Mechanism for Retrieval Augmented Generation
- Title(参考訳): BiRD: 検索能力向上のための双方向ランキング防衛機構
- Authors: Chengcai Gao, Zhihong Sun, Xiaochuan Shi, Qiufeng Wang, Chao Liang,
- Abstract要約: 既存の防衛は、セマンティック分析や投票に依存しており、高い計算コストと強力な毒殺攻撃下での限られた堅牢性とのトレードオフに直面している。
デュアル信号フレームワーク上に構築された双方向のランキング防衛機構であるBiRDを提案する。
BiRDはPoisonedRAGの攻撃成功率を最大54%削減し,同時にタスク精度を最大56%向上させる。
- 参考スコア(独自算出の注目度): 11.953825630545424
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing adoption of Retrieval-Augmented Generation (RAG) has led to a rise in adversarial attacks. Existing defenses, relying on semantic analysis or voting, face a trade-off between high computational cost and limited robustness under strong poisoning attacks. Their fundamental limitation is the exclusive focus on semantic content relevance, while neglecting the retrieval context that is critically defined by ranking structures. To this end, we investigate the bidirectional ranking behavior of poisoned and benign documents, and discover a key discriminative pattern: poisoned documents exhibit significantly stronger alignment between their backward rankings and the query's forward ranking. Capitalizing on this, we propose BiRD, a bidirectional ranking defense mechanism built upon a dual-signal framework that leverages forward ranking to assess semantic content relevance and backward ranking to quantify ranking context consistency. This design directly addresses the fundamental limitation of prior approaches, enabling simultaneous efficiency and robustness. Extensive evaluation across 3 datasets with 3 retrievers and 3 LLMs under 2 attack scenarios validates BiRD's effectiveness. Notably, BiRD reduces the attack success rate of PoisonedRAG by up to 54% while simultaneously improving task accuracy by up to 56%, with average additional latency under 1 second.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) の採用が増加し、敵の攻撃が増加している。
既存の防衛は、セマンティック分析や投票に依存しており、高い計算コストと強力な毒殺攻撃下での限られた堅牢性とのトレードオフに直面している。
彼らの基本的な制限は、セマンティックな内容の関連性に排他的な焦点をあてる一方で、ランキング構造によって決定的に定義される検索コンテキストを無視することである。
そこで本研究では,有毒文書と良性文書の双方向のランク付け行動を調査し,重要な識別パターンを明らかにする。
そこで本稿では,双方向のランキング防衛機構であるBiRDを提案する。このメカニズムは,フォワードランキングを利用してセマンティックコンテンツ関連性を評価し,下位ランキングを用いてランキングコンテキストの一貫性を定量的に評価する。
この設計は、事前アプローチの基本的な制限に直接対処し、同時に効率性と堅牢性を実現する。
2つの攻撃シナリオの下で3つのレトリバーと3つのLLMを持つ3つのデータセットにわたる広範囲な評価は、BiRDの有効性を検証する。
特に、BiRDはPoisonedRAGの攻撃成功率を最大54%削減し、同時にタスク精度を最大56%改善し、平均的な追加レイテンシは1秒以下である。
関連論文リスト
- Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems [55.04168927059962]
推論集約的な検索は、単にトピックの類似性に一致するのではなく、下流の推論を支持する証拠を明らかにすることを目的としている。
BRIGHT-Proは、専門家による注釈付きベンチマークで、各クエリを複数アスペクトのゴールドエビデンスで拡張する。
また,相補的な正と正条件の強陰性を生成するアスペクト分解型合成コーパスであるRTriever-Synthを構築した。
論文 参考訳(メタデータ) (2026-05-05T17:42:50Z) - RefineRAG: Word-Level Poisoning Attacks via Retriever-Guided Text Refinement [2.725904394644371]
Retrieval-Augmented Generation (RAG)はLarge Language Models (LLM)を大幅に強化する
PoisonedRAGのような既存の攻撃方法は、粗い粒度の分離・連結戦略のために検出可能である。
RefineRAGは, 毒素を総括的単語レベルでの精製問題として扱う新しいフレームワークである。
論文 参考訳(メタデータ) (2026-04-08T10:33:54Z) - AttackEval: A Systematic Empirical Study of Prompt Injection Attack Effectiveness Against Large Language Models [0.0]
アタックエヴァル(AttackEval)は、インジェクション攻撃の有効性の体系的研究である。
我々は3つの親集団(シンタクティック、コンテクチュアル、セマンティック/社会)に分類される10の攻撃カテゴリーの分類を構築する。
本研究は,4つのより強力な防衛層下での模擬生産犠牲者システムに対して評価を行った。
論文 参考訳(メタデータ) (2026-04-04T05:49:30Z) - ProGRank: Probe-Gradient Reranking to Defend Dense-Retriever RAG from Corpus Poisoning [5.725082598014574]
Retrieval-Augmented Generation (RAG) は、検索された証拠に生成を基礎づけることで、大規模言語モデルの信頼性を向上させる。
相手がパスを注入または編集して、ターゲットクエリのTop-K$結果にランク付けし、下流生成に影響を与えるようにします。
本稿では,高密度レトリバーRAGのためのポストホック,トレーニングフリーレトリバーサイドディフェンスであるProGRankを提案する。
論文 参考訳(メタデータ) (2026-03-24T08:29:15Z) - Thinking Forward and Backward: Multi-Objective Reinforcement Learning for Retrieval-Augmented Reasoning [137.33138614095435]
Retrieval-augmented Generation (RAG) は、大規模言語モデルにおける幻覚の緩和に有効であることが証明されている。
近年、検索に基づく対話をRAGに組み込んで、リアルタイム検索による反復推論を可能にしている。
提案するBi-RARは,各中間ステップを前方方向と後方方向の両方で共同で評価する,新たな検索拡張推論フレームワークである。
論文 参考訳(メタデータ) (2025-11-12T08:29:39Z) - A Tale of HodgeRank and Spectral Method: Target Attack Against Rank
Aggregation Is the Fixed Point of Adversarial Game [153.74942025516853]
ランクアグリゲーション手法の本質的な脆弱性は文献ではよく研究されていない。
本稿では,ペアデータの変更による集計結果の指定を希望する目的のある敵に焦点をあてる。
提案した標的攻撃戦略の有効性は,一連の玩具シミュレーションと実世界のデータ実験によって実証された。
論文 参考訳(メタデータ) (2022-09-13T05:59:02Z) - Improved Certified Defenses against Data Poisoning with (Deterministic)
Finite Aggregation [122.83280749890078]
本報告では, 一般中毒に対する予防的対策として, フィニット・アグリゲーション(Finite Aggregation)を提案する。
トレーニングセットを直接非結合部分集合に分割するDPAとは対照的に、我々の方法はまず、トレーニングセットをより小さな非結合部分集合に分割する。
我々は、決定論的および集約的認証された防御設計をブリッジして、我々の方法の代替的な見解を提供する。
論文 参考訳(メタデータ) (2022-02-05T20:08:58Z) - Adversarial Attack and Defense in Deep Ranking [100.17641539999055]
本稿では,敵対的摂動によって選抜された候補者のランクを引き上げたり下げたりできる,ディープランキングシステムに対する2つの攻撃を提案する。
逆に、全ての攻撃に対するランキングモデルロバスト性を改善するために、反崩壊三重項防御法が提案されている。
MNIST, Fashion-MNIST, CUB200-2011, CARS196およびStanford Online Productsデータセットを用いて, 敵のランク付け攻撃と防御を評価した。
論文 参考訳(メタデータ) (2021-06-07T13:41:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。