論文の概要: Efficient Privacy-Preserving Retrieval Augmented Generation with Distance-Preserving Encryption
- arxiv url: http://arxiv.org/abs/2601.12331v1
- Date: Sun, 18 Jan 2026 09:29:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.580791
- Title: Efficient Privacy-Preserving Retrieval Augmented Generation with Distance-Preserving Encryption
- Title(参考訳): 距離保存暗号を用いた高効率なプライバシ保存検索生成
- Authors: Huanyi Ye, Jiale Guo, Ziyao Liu, Kwok-Yan Lam,
- Abstract要約: RAGは高い計算コストを伴わずにLLMの応答品質を向上させる重要な技術として登場した。
従来のアーキテクチャでは、RAGサービスは、信頼できるローカル環境内でデータセットをホストする単一のエンティティによって提供される。
信頼できないサードパーティサービスへの依存は、プライバシーのリスクをもたらす。
信頼できないクラウド環境に適した効率的なプライバシ保護RAGフレームワーク(ppRAG)を提案する。
- 参考スコア(独自算出の注目度): 25.87368479678027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RAG has emerged as a key technique for enhancing response quality of LLMs without high computational cost. In traditional architectures, RAG services are provided by a single entity that hosts the dataset within a trusted local environment. However, individuals or small organizations often lack the resources to maintain data storage servers, leading them to rely on outsourced cloud storage. This dependence on untrusted third-party services introduces privacy risks. Embedding-based retrieval mechanisms, commonly used in RAG systems, are vulnerable to privacy leakage such as vector-to-text reconstruction attacks and structural leakage via vector analysis. Several privacy-preserving RAG techniques have been proposed but most existing approaches rely on partially homomorphic encryption, which incurs substantial computational overhead. To address these challenges, we propose an efficient privacy-preserving RAG framework (ppRAG) tailored for untrusted cloud environments that defends against vector-to-text attack, vector analysis, and query analysis. We propose Conditional Approximate Distance-Comparison-Preserving Symmetric Encryption (CAPRISE) that encrypts embeddings while still allowing the cloud to compute similarity between an encrypted query and the encrypted database embeddings. CAPRISE preserves only the relative distance ordering between the encrypted query and each encrypted database embedding, without exposing inter-database distances, thereby enhancing both privacy and efficiency. To mitigate query analysis, we introduce DP by perturbing the query embedding prior to encryption, preventing the cloud from inferring sensitive patterns. Experimental results show that ppRAG achieves efficient processing throughput, high retrieval accuracy, strong privacy guarantees, making it a practical solution for resource-constrained users seeking secure cloud-augmented LLMs.
- Abstract(参考訳): RAGは高い計算コストを伴わずにLLMの応答品質を向上させる重要な技術として登場した。
従来のアーキテクチャでは、RAGサービスは、信頼できるローカル環境内でデータセットをホストする単一のエンティティによって提供される。
しかし、個人や小さな組織は、しばしばデータストレージサーバを維持するためのリソースを欠いているため、アウトソースのクラウドストレージに依存している。
信頼できないサードパーティサービスへの依存は、プライバシーのリスクをもたらす。
RAGシステムで一般的に使用される埋め込みベースの検索機構は、ベクトルからテキストへの再構成攻撃やベクトル解析による構造的漏洩などのプライバシー漏洩に対して脆弱である。
いくつかのプライバシ保護RAG技術が提案されているが、既存のほとんどのアプローチは部分的に同型暗号化に依存しており、かなりの計算オーバーヘッドを引き起こす。
これらの課題に対処するため,ベクトル・ツー・テキスト・アタック,ベクトル解析,クエリ解析から保護される信頼できないクラウド環境に適した,効率的なプライバシ保護のためのRAGフレームワーク(ppRAG)を提案する。
本研究では,暗号化されたクエリと暗号化されたデータベースの埋め込みの類似性をクラウド上で計算しながら,埋め込みを暗号化する条件付き近似距離比較暗号(CAPRISE)を提案する。
CAPRISEは、データベース間距離を露呈することなく、暗号化されたクエリと各暗号化されたデータベースの埋め込みの間の相対的な距離だけを保存し、プライバシーと効率の両方を向上する。
問合せ解析を緩和するために, 暗号化に先立って, 問合せ埋め込みを摂動することでDPを導入し, クラウドがセンシティブなパターンを推測することを防止した。
実験結果から,pRAGは効率的な処理スループット,高い検索精度,強力なプライバシ保証を実現し,セキュアなクラウド拡張LDMを求めるリソース制約のあるユーザに対して実用的なソリューションであることがわかった。
関連論文リスト
- Multiparty Authorization for Secure Data Storage in Cloud Environments using Improved Attribute-Based Encryption [0.0]
Attribute-Based Encryption (ABE)は、セキュアなデータストレージと認証のためのセキュリティおよびアクセス制御技術の1つである。
i) 認証されたユーザへのアクセスを提供し,ii) クラウド環境におけるセキュアなデータストレージを提供する。
セキュリティおよび性能分析の結果、提案手法はより堅牢で安全であることが示されている。
論文 参考訳(メタデータ) (2025-12-29T05:41:08Z) - Towards Privacy-Preserving Range Queries with Secure Learned Spatial Index over Encrypted Data [8.495233108444202]
本稿では,暗号化データセット上での新たなプライバシ保護範囲クエリ手法を提案する。
SLS-INDEXは、Paillier暗号システムと階層的な予測アーキテクチャとノイズ注入バケットを統合している。
SLRQは、データセット、クエリ、結果、アクセスパターンのプライバシを確保しながら、クエリ効率で既存のソリューションを大幅に上回る。
論文 参考訳(メタデータ) (2025-12-03T10:59:40Z) - Privacy-Preserving Federated Embedding Learning for Localized Retrieval-Augmented Generation [60.81109086640437]
我々はFedE4RAG(Federated Retrieval-Augmented Generation)と呼ばれる新しいフレームワークを提案する。
FedE4RAGはクライアント側RAG検索モデルの協調トレーニングを容易にする。
モデルパラメータの保護にフェデレート学習の準同型暗号化を適用する。
論文 参考訳(メタデータ) (2025-04-27T04:26:02Z) - HOPE: Homomorphic Order-Preserving Encryption for Outsourced Databases -- A Stateless Approach [0.7770535067924795]
Homomorphic OPE(Homomorphic OPE)は、クライアント側のストレージを排除し、クエリ実行中に追加のクライアントサーバ間のインタラクションを回避する新しいOPEスキームである。
我々は、広く受け入れられているIND-OCPAモデルの下で、HOPEの正式な暗号解析を行い、その安全性を証明した。
論文 参考訳(メタデータ) (2024-11-26T00:38:46Z) - FRAG: Toward Federated Vector Database Management for Collaborative and Secure Retrieval-Augmented Generation [1.3824176915623292]
本稿では,検索集約システム (RAG) のニーズの増大に対応する新しいデータベース管理パラダイムである textitFederated Retrieval-Augmented Generation (FRAG) を紹介する。
FRAGは、ANN(Approximate $k$-Nearest Neighbor)による、暗号化されたクエリベクタと分散ベクトルデータベースに格納された暗号化データ検索を相互に行うことができる。
論文 参考訳(メタデータ) (2024-10-17T06:57:29Z) - Optimizing Cross-Client Domain Coverage for Federated Instruction Tuning of Large Language Models [87.49293964617128]
大規模言語モデル(LLM)のためのFedDIT(Federated Domain-specific instruction tuning)は、分散プライベートデータと限定データを用いて、特定のドメインの性能を向上させることを目的としている。
データ不均一性ではなく、クロスクライアントなドメインカバレッジが重要な要素であることを実証的に証明します。
我々は多様性指向のクライアントセンターの選択と検索に基づく拡張を通じて、このカバレッジを明示的に最大化するアルゴリズムであるFedDCAを紹介する。
論文 参考訳(メタデータ) (2024-09-30T09:34:31Z) - Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
機密情報を含む匿名化は、幅広いアプリケーションにとって不可欠である。
既存の技術は、大規模言語モデルの再識別能力の新たな課題に直面している。
本稿では,プライバシ評価器,ユーティリティ評価器,最適化コンポーネントの3つの重要なコンポーネントで構成されるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T14:28:56Z) - Enc2DB: A Hybrid and Adaptive Encrypted Query Processing Framework [47.11111145443189]
本稿では,新しいセキュアデータベースシステムであるEnc2DBを紹介する。
本稿では,マイクロベンチマークテストと自己適応型モードスイッチ戦略を提案し,与えられたクエリに応答する最適な実行パス(暗号やTEE)を選択する。
また、クエリ処理を高速化するために、ネイティブコストモデルやクエリと互換性のある暗号文インデックスを設計、実装する。
論文 参考訳(メタデータ) (2024-04-10T08:11:12Z) - Is Vertical Logistic Regression Privacy-Preserving? A Comprehensive
Privacy Analysis and Beyond [57.10914865054868]
垂直ロジスティック回帰(VLR)をミニバッチ降下勾配で訓練した。
我々は、オープンソースのフェデレーション学習フレームワークのクラスにおいて、VLRの包括的で厳密なプライバシー分析を提供する。
論文 参考訳(メタデータ) (2022-07-19T05:47:30Z) - Decentralized Stochastic Optimization with Inherent Privacy Protection [103.62463469366557]
分散最適化は、現代の協調機械学習、分散推定と制御、大規模センシングの基本的な構成要素である。
データが関与して以降、分散最適化アルゴリズムの実装において、プライバシ保護がますます重要になっている。
論文 参考訳(メタデータ) (2022-05-08T14:38:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。