論文の概要: PRAG: End-to-End Privacy-Preserving Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2604.26525v2
- Date: Thu, 30 Apr 2026 01:57:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 14:06:12.737468
- Title: PRAG: End-to-End Privacy-Preserving Retrieval-Augmented Generation
- Title(参考訳): PRAG: エンドツーエンドのプライバシ保護型検索機能付きジェネレーション
- Authors: Zhijun Li, Minghui Xu, Huayi Qi, Wenxuan Yu, Tingchuang Zhang, Qiao Zhang, GuangYong Shang, Zhen Ma, Xiuzhen Cheng,
- Abstract要約: 既存のプライバシー保護ソリューションは、ノイズ注入による検索品質を犠牲にしたり、部分暗号化のみを提供する。
本稿では,文書とクエリの両方に対してエンドツーエンドの機密性を実現する,エンドツーエンドのプライバシ保護システムPRAGを提案する。
大規模データセットの実験では、PRAGは競争力のあるリコール(72.45%-74.45%)、実用的な検索遅延、グラフ再構成攻撃に対する強力なレジリエンスを達成している。
- 参考スコア(独自算出の注目度): 15.502387220719813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-Augmented Generation (RAG) is essential for enhancing Large Language Models (LLMs) with external knowledge, but its reliance on cloud environments exposes sensitive data to privacy risks. Existing privacy-preserving solutions often sacrifice retrieval quality due to noise injection or only provide partial encryption. We propose PRAG, an end-to-end privacy-preserving RAG system that achieves end-to-end confidentiality for both documents and queries without sacrificing the scalability of cloud-hosted RAG. PRAG features a dual-mode architecture: a non-interactive PRAG-I utilizes homomorphic-friendly approximations for low-latency retrieval, while an interactive PRAG-II leverages client assistance to match the accuracy of non-private RAG. To ensure robust semantic ordering, we introduce Operation-Error Estimation (OEE), a mechanism that stabilizes ranking against homomorphic noise. Experiments on large-scale datasets demonstrate that PRAG achieves competitive recall (72.45%-74.45%), practical retrieval latency, and strong resilience against graph reconstruction attacks while maintaining end-to-end confidentiality. This work confirms the feasibility of secure, high-performance RAG at scale.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG)は、外部知識によるLarge Language Models (LLM)の拡張に不可欠だが、クラウド環境への依存は、機密データをプライバシリスクに公開する。
既存のプライバシー保護ソリューションは、ノイズ注入による検索品質を犠牲にしたり、部分暗号化のみを提供する。
クラウドホスト型RAGのスケーラビリティを犠牲にすることなく、文書とクエリの両方のエンドツーエンドの機密性を実現する、エンドツーエンドのプライバシ保存RAGシステムであるPRAGを提案する。
対話型PRAG-IIは非プライベートRAGの精度に合うようにクライアントアシストを利用する。
頑健なセマンティックオーダリングを保証するため,同型雑音に対するランク付けを安定化するOEE(Operation-Error Estimation)を導入する。
大規模データセットの実験では、PRAGが競合リコール(72.45%-74.45%)、実用的な検索遅延、グラフ復元攻撃に対する強力なレジリエンスを実現し、エンドツーエンドの機密性を維持している。
本研究は,安全かつ高性能なRAGの実現可能性を確認するものである。
関連論文リスト
- Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions [89.52532304099522]
フェデレートラーニング(FL)は、クライアントが生データを集中せずに共有モデルを共同でトレーニングすることを可能にし、固有のプライバシーレベルを提供する。
グラデーションとモデル更新は機密情報を漏洩する可能性があるが、悪意のあるサーバはビザンティン操作のような敵攻撃をマウントする可能性がある。
これらの脆弱性は、統合されたフレームワーク内の差分プライバシー(DP)とビザンチンの堅牢性に対処する必要性を強調している。
Byz-Clip21-SGD2Mを提案する。
論文 参考訳(メタデータ) (2026-03-24T17:39:09Z) - Efficient Privacy-Preserving Retrieval Augmented Generation with Distance-Preserving Encryption [25.87368479678027]
RAGは高い計算コストを伴わずにLLMの応答品質を向上させる重要な技術として登場した。
従来のアーキテクチャでは、RAGサービスは、信頼できるローカル環境内でデータセットをホストする単一のエンティティによって提供される。
信頼できないサードパーティサービスへの依存は、プライバシーのリスクをもたらす。
信頼できないクラウド環境に適した効率的なプライバシ保護RAGフレームワーク(ppRAG)を提案する。
論文 参考訳(メタデータ) (2026-01-18T09:29:50Z) - ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search [69.60882125603133]
本稿では,検索した文書の信頼性情報を明確に活用する,敵対的堅牢性のためのフレームワークであるReliabilityRAGを提案する。
我々の研究は、RAGの回収されたコーパスの腐敗に対するより効果的で確実に堅牢な防御に向けた重要な一歩である。
論文 参考訳(メタデータ) (2025-09-27T22:36:42Z) - Privacy-Aware Decoding: Mitigating Privacy Leakage of Large Language Models in Retrieval-Augmented Generation [26.573578326262307]
プライバシ・アウェア・デコーディング(英: Privacy-Aware Decoding、PAD)は、ガウス雑音を発生時にトークンロジットに適応的に注入する軽量な推論時防御法である。
PADは信頼性ベースのスクリーニングを統合して、リスクの高いトークンを選択的に保護し、不要なノイズを最小限に抑える効率的な感度推定と、プライバシと生成品質のバランスをとるためのコンテキスト対応ノイズ校正を行う。
我々の研究は、機密ドメインにおける普遍的でスケーラブルなプライバシソリューションを実現するために、デコード戦略を通じて、RAGのプライバシリスクを軽減するための重要な一歩を踏み出しています。
論文 参考訳(メタデータ) (2025-08-05T05:22:13Z) - Privacy-Preserving Federated Embedding Learning for Localized Retrieval-Augmented Generation [60.81109086640437]
我々はFedE4RAG(Federated Retrieval-Augmented Generation)と呼ばれる新しいフレームワークを提案する。
FedE4RAGはクライアント側RAG検索モデルの協調トレーニングを容易にする。
モデルパラメータの保護にフェデレート学習の準同型暗号化を適用する。
論文 参考訳(メタデータ) (2025-04-27T04:26:02Z) - MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0423152595537]
本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。
MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。
実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文 参考訳(メタデータ) (2025-03-17T08:09:42Z) - TrustRAG: Enhancing Robustness and Trustworthiness in Retrieval-Augmented Generation [31.231916859341865]
TrustRAGは、生成のために取得される前に、悪意のある、無関係なコンテンツを体系的にフィルタリングするフレームワークである。
TrustRAGは、検索精度、効率、攻撃抵抗を大幅に改善する。
論文 参考訳(メタデータ) (2025-01-01T15:57:34Z) - Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.41288763521186]
Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。
RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。
検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文 参考訳(メタデータ) (2024-06-20T22:53:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。