論文の概要: PIR-RAG: A System for Private Information Retrieval in Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2509.21325v1
- Date: Mon, 01 Sep 2025 07:28:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 05:29:07.736176
- Title: PIR-RAG: A System for Private Information Retrieval in Retrieval-Augmented Generation
- Title(参考訳): PIR-RAG:検索・拡張世代における個人情報検索システム
- Authors: Baiqiang Wang, Qian Lou, Mengxin Zheng, Dongfang Zhao,
- Abstract要約: Retrieval-Augmented Generation(RAG)は、現代のAIシステムの基本コンポーネントとなっているが、サービスプロバイダにユーザクエリを公開することによって、重大なプライバシーリスクが生じる。
PIR-RAGは、粗いセマンティッククラスタリングを使用して検索空間をプルークし、高速で格子ベースのPrivate Information Retrievalプロトコルと組み合わせた新しいアーキテクチャを採用している。
我々の研究はPIR-RAGを、大規模AIシステムにおけるプライバシーのための実用的で高効率なソリューションとして確立しています。
- 参考スコア(独自算出の注目度): 15.952659244056802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-Augmented Generation (RAG) has become a foundational component of modern AI systems, yet it introduces significant privacy risks by exposing user queries to service providers. To address this, we introduce PIR-RAG, a practical system for privacy-preserving RAG. PIR-RAG employs a novel architecture that uses coarse-grained semantic clustering to prune the search space, combined with a fast, lattice-based Private Information Retrieval (PIR) protocol. This design allows for the efficient retrieval of entire document clusters, uniquely optimizing for the end-to-end RAG workflow where full document content is required. Our comprehensive evaluation against strong baseline architectures, including graph-based PIR and Tiptoe-style private scoring, demonstrates PIR-RAG's scalability and its superior performance in terms of "RAG-Ready Latency"-the true end-to-end time required to securely fetch content for an LLM. Our work establishes PIR-RAG as a viable and highly efficient solution for privacy in large-scale AI systems.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG)は、現代のAIシステムの基本コンポーネントとなっているが、サービスプロバイダにユーザクエリを公開することで、重大なプライバシーリスクが生じる。
そこで本研究では,プライバシ保護RAGのための実用システムであるPIR-RAGを紹介する。
PIR-RAGは、粗いセマンティッククラスタリングを使用して検索空間をプルークし、高速で格子ベースのPrivate Information Retrieval (PIR)プロトコルと組み合わせた新しいアーキテクチャを採用している。
この設計は、ドキュメントクラスタ全体の効率的な検索を可能にし、完全なドキュメントコンテンツを必要とするエンドツーエンドのRAGワークフローを一意に最適化する。
グラフベースのPIRやTiptoeスタイルのプライベートスコアなど,強力なベースラインアーキテクチャに対する包括的な評価は,LLMのコンテンツを確実にフェッチするために必要な真のエンドツーエンド時間である"RAG-Ready Latency"の観点から,PIR-RAGのスケーラビリティと優れたパフォーマンスを示す。
我々の研究はPIR-RAGを、大規模AIシステムにおけるプライバシーのための実用的で高効率なソリューションとして確立しています。
関連論文リスト
- Versatile and Fast Location-Based Private Information Retrieval with Fully Homomorphic Encryption over the Torus [4.021179028452984]
本稿では,ユーザプライバシの保護を目的としたPIRシステムであるVeLoPIRを提案する。
VeLoPIRは3つの操作モード(インターバルバリデーション、座標バリデーション、識別子マッチング)を導入し、幅広い現実世界のアプリケーションをサポートする。
我々は、セキュリティとプライバシの正式な証明を提供し、標準的な暗号的仮定の下でシステムの堅牢性を確認する。
論文 参考訳(メタデータ) (2025-06-15T08:01:35Z) - Privacy-Preserving Federated Embedding Learning for Localized Retrieval-Augmented Generation [60.81109086640437]
我々はFedE4RAG(Federated Retrieval-Augmented Generation)と呼ばれる新しいフレームワークを提案する。
FedE4RAGはクライアント側RAG検索モデルの協調トレーニングを容易にする。
モデルパラメータの保護にフェデレート学習の準同型暗号化を適用する。
論文 参考訳(メタデータ) (2025-04-27T04:26:02Z) - UltraRAG: A Modular and Automated Toolkit for Adaptive Retrieval-Augmented Generation [64.79921229760332]
Retrieval-Augmented Generation (RAG) は、下流タスクにおける大規模言語モデル(LLM)の性能を大幅に向上させる。
既存のRAGツールキットは、特定のアプリケーションシナリオに適した知識適応をサポートしていない。
ワークフロー全体を通して知識適応を自動化するRAGツールキットであるUltraRAGを提案する。
論文 参考訳(メタデータ) (2025-03-31T03:49:49Z) - MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0423152595537]
本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。
MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。
実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文 参考訳(メタデータ) (2025-03-17T08:09:42Z) - A Comprehensive Survey on Composed Image Retrieval [54.54527281731775]
Composed Image Retrieval (CIR)は、ユーザがマルチモーダルクエリを使ってターゲットイメージを検索できる、新しくて困難なタスクである。
現在、この分野のタイムリーな概要を提供するため、CIRの包括的なレビューは行われていない。
我々は、ACM TOIS、SIGIR、CVPRなど、トップカンファレンスやジャーナルで120以上の出版物から洞察を合成する。
論文 参考訳(メタデータ) (2025-02-19T01:37:24Z) - Dataset Protection via Watermarked Canaries in Retrieval-Augmented LLMs [67.0310240737424]
本稿では,テキストデータセットの所有権を保護し,RA-LLMによる不正使用を効果的に検出するための新しいアプローチを提案する。
提案手法では,IPデータセットに特別に設計されたカナリア文書を挿入することにより,元のデータを完全に変更することなく保護する。
検出プロセス中、カナリア文書をクエリし、RA-LLMの応答を分析することにより、不正使用を識別する。
論文 参考訳(メタデータ) (2025-02-15T04:56:45Z) - C-FedRAG: A Confidential Federated Retrieval-Augmented Generation System [7.385458207094507]
我々は、FedRAG(Federated Retrieval Augmented Generation)をセキュアにするためのソリューションとして、CC(Confidential Computing)技術を紹介する。
提案するConfidential FedRAGシステム(C-FedRAG)は、コンテキスト機密性を確保することにより、分散化されたデータプロバイダのネットワークをまたいだRAGのセキュアな接続とスケーリングを可能にする。
論文 参考訳(メタデータ) (2024-12-17T18:42:21Z) - FastRAG: Retrieval Augmented Generation for Semi-structured Data [1.4249472316161877]
本稿では,半構造化データを対象とした新しいRAG手法であるFastRAGを紹介する。
FastRAGはスキーマ学習とスクリプト学習を使用して、全データソースをLLMに送信することなく、データを抽出し、構造化する。
テキスト検索と知識グラフクエリを統合して、コンテキスト豊富な情報を取得する精度を向上させる。
論文 参考訳(メタデータ) (2024-11-21T01:00:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。