Fugu-MT 論文翻訳(概要): ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search

論文の概要: ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search

arxiv url: http://arxiv.org/abs/2509.23519v1
Date: Sat, 27 Sep 2025 22:36:42 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-30 22:32:19.271896
Title: ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search
Title（参考訳）: ReliabilityRAG:RAGベースのWeb検索のための効果的でおそらくロバストな防御
Authors: Zeyu Shen, Basileal Imana, Tong Wu, Chong Xiang, Prateek Mittal, Aleksandra Korolova,
Abstract要約: 本稿では,検索した文書の信頼性情報を明確に活用する,敵対的堅牢性のためのフレームワークであるReliabilityRAGを提案する。我々の研究は、RAGの回収されたコーパスの腐敗に対するより効果的で確実に堅牢な防御に向けた重要な一歩である。
参考スコア（独自算出の注目度）: 69.60882125603133
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Retrieval-Augmented Generation (RAG) enhances Large Language Models by grounding their outputs in external documents. These systems, however, remain vulnerable to attacks on the retrieval corpus, such as prompt injection. RAG-based search systems (e.g., Google's Search AI Overview) present an interesting setting for studying and protecting against such threats, as defense algorithms can benefit from built-in reliability signals -- like document ranking -- and represent a non-LLM challenge for the adversary due to decades of work to thwart SEO. Motivated by, but not limited to, this scenario, this work introduces ReliabilityRAG, a framework for adversarial robustness that explicitly leverages reliability information of retrieved documents. Our first contribution adopts a graph-theoretic perspective to identify a "consistent majority" among retrieved documents to filter out malicious ones. We introduce a novel algorithm based on finding a Maximum Independent Set (MIS) on a document graph where edges encode contradiction. Our MIS variant explicitly prioritizes higher-reliability documents and provides provable robustness guarantees against bounded adversarial corruption under natural assumptions. Recognizing the computational cost of exact MIS for large retrieval sets, our second contribution is a scalable weighted sample and aggregate framework. It explicitly utilizes reliability information, preserving some robustness guarantees while efficiently handling many documents. We present empirical results showing ReliabilityRAG provides superior robustness against adversarial attacks compared to prior methods, maintains high benign accuracy, and excels in long-form generation tasks where prior robustness-focused methods struggled. Our work is a significant step towards more effective, provably robust defenses against retrieved corpus corruption in RAG.
Abstract（参考訳）: Retrieval-Augmented Generation (RAG)は、アウトプットを外部文書に基盤として、大規模言語モデルを強化する。しかし、これらのシステムは、プロンプトインジェクションのような、検索コーパスに対する攻撃に対して脆弱なままである。 RAGベースの検索システム(例えば、Googleの検索AI概要)は、防衛アルゴリズムがドキュメントランキングのような組み込みの信頼性信号から恩恵を受けることができるため、このような脅威を調査し、保護するために興味深い設定を提供する。このシナリオでは、検索したドキュメントの信頼性情報を明示的に活用する、敵の堅牢性のためのフレームワークであるReliabilityRAGを導入する。最初のコントリビューションでは、検索したドキュメントの中で“一貫性のある多数”を識別し、悪意のあるドキュメントをフィルタリングするグラフ理論の視点を採用しています。本稿では,エッジが矛盾を符号化する文書グラフ上で,最大独立集合(MIS)の探索に基づく新しいアルゴリズムを提案する。我々のMIS変種は、信頼性の高い文書を明示的に優先順位付けし、自然条件下での有界敵の腐敗に対する証明可能な堅牢性を保証する。大規模な検索集合に対する正確なMISの計算コストを認識し,2つ目の貢献は拡張性のある重み付きサンプルと集約フレームワークである。信頼性情報を明示的に利用し、多くのドキュメントを効率的に処理しながら、堅牢性を保証する。本稿では,ReliabilityRAGが従来の手法に比べ,敵の攻撃に対して優れた堅牢性を提供し,良性な精度を維持し,先行の堅牢性を重視した手法が難しかった長文生成タスクに優れることを示す実験結果を示す。我々の研究は、RAGの回収されたコーパスの腐敗に対するより効果的で確実に堅牢な防御に向けた重要な一歩である。

関連論文リスト

BAPO: Boundary-Aware Policy Optimization for Reliable Agentic Search [72.87861928940929]
バウンダリ・アウェア・ポリシー・オプティマイゼーション(BAPO)は、信頼性の高い境界認識を精度を損なうことなく育成する新しいRLフレームワークである。 BAPOは2つの重要な要素を導入する: (i) グループベースの境界対応報酬(i) 推論が限界に達したときのみIDK応答を促進させる) 適応報酬変調器(ii) 早期探索中にこの報酬を戦略的に停止させ、モデルがIDKをショートカットとして利用するのを防ぐ。
論文参考訳（メタデータ） (2026-01-16T07:06:58Z)
SeCon-RAG: A Two-Stage Semantic Filtering and Conflict-Free Framework for Trustworthy RAG [35.42029959485188]
Retrieval-augmented Generation (RAG) システムは、外部知識を持つ大規模言語モデルを強化する。既存の防御は、しばしば攻撃的なフィルタリングを適用し、不要な貴重な情報が失われる。信頼性の高いRAGのための2段階のセマンティックフィルタリングとコンフリクトフリーフレームワークを提案する。
論文参考訳（メタデータ） (2025-10-10T03:44:29Z)
Who Stole Your Data? A Method for Detecting Unauthorized RAG Theft [16.826893547339548]
本稿では,RAGプラジャリズム検出に特化して設計された新しいデータセットであるRADを紹介する。セマンティックレベルと語彙レベルの両方で保護を埋め込んだ二重層透かしシステムを開発した。この研究は、検索強化AIシステムにおける知的財産権保護の基盤となる枠組みを確立する。
論文参考訳（メタデータ） (2025-10-09T03:09:18Z)
Towards Reliable Retrieval in RAG Systems for Large Legal Datasets [6.376251215279889]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚を緩和するための有望なアプローチであるこれは、構造的に類似したドキュメントの大規模なデータベースが、しばしば検索システムに障害を引き起こす、法的領域において特に困難である。文書レベルの合成要約で各テキストチャンクを拡大する,単純で効率的な手法について検討する。我々の研究は、この実用的でスケーラブルで、容易に統合可能な手法が、大規模法的文書データセットに適用した場合、RAGシステムの信頼性を高める証拠を提供する。
論文参考訳（メタデータ） (2025-10-08T13:22:20Z)
Provably Secure Retrieval-Augmented Generation [7.412110686946628]
本稿では,RAG(Retrieval-Augmented Generation)システムのための,信頼性の高い最初のフレームワークを提案する。我々のフレームワークは、検索したコンテンツとベクトル埋め込みの両方の二重保護を保証するために、プレストレージのフル暗号化方式を採用している。
論文参考訳（メタデータ） (2025-08-01T21:37:16Z)
MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0423152595537]
本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。 MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文参考訳（メタデータ） (2025-03-17T08:09:42Z)
TrustRAG: Enhancing Robustness and Trustworthiness in Retrieval-Augmented Generation [31.231916859341865]
TrustRAGは、生成のために取得される前に、悪意のある、無関係なコンテンツを体系的にフィルタリングするフレームワークである。 TrustRAGは、検索精度、効率、攻撃抵抗を大幅に改善する。
論文参考訳（メタデータ） (2025-01-01T15:57:34Z)
FRAG: Toward Federated Vector Database Management for Collaborative and Secure Retrieval-Augmented Generation [1.3824176915623292]
本稿では,検索集約システム (RAG) のニーズの増大に対応する新しいデータベース管理パラダイムである textitFederated Retrieval-Augmented Generation (FRAG) を紹介する。 FRAGは、ANN(Approximate $k$-Nearest Neighbor)による、暗号化されたクエリベクタと分散ベクトルデータベースに格納された暗号化データ検索を相互に行うことができる。
論文参考訳（メタデータ） (2024-10-17T06:57:29Z)
Certifiably Robust RAG against Retrieval Corruption [58.677292678310934]
Retrieval-augmented Generation (RAG) は、回復汚職攻撃に弱いことが示されている。本稿では,ロバストRAGを検索汚職攻撃に対する最初の防御フレームワークとして提案する。
論文参考訳（メタデータ） (2024-05-24T13:44:25Z)
Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文参考訳（メタデータ） (2023-12-18T05:42:31Z)
Doubly Robust Instance-Reweighted Adversarial Training [107.40683655362285]
本稿では,2重のインスタンス再重み付き対向フレームワークを提案する。 KL偏差正規化損失関数の最適化により重みを求める。提案手法は, 平均ロバスト性能において, 最先端のベースライン法よりも優れた性能を示す。
論文参考訳（メタデータ） (2023-08-01T06:16:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。