論文の概要: Privacy-Preserving Product-Quantized Approximate Nearest Neighbor Search Framework for Large-scale Datasets via A Hybrid of Fully Homomorphic Encryption and Trusted Execution Environment
- arxiv url: http://arxiv.org/abs/2604.17816v1
- Date: Mon, 20 Apr 2026 05:14:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.702907
- Title: Privacy-Preserving Product-Quantized Approximate Nearest Neighbor Search Framework for Large-scale Datasets via A Hybrid of Fully Homomorphic Encryption and Trusted Execution Environment
- Title(参考訳): 完全同型暗号化と信頼された実行環境のハイブリッドによる大規模データセットを対象としたプライバシ保護製品定位近似近傍探索フレームワーク
- Authors: Shozo Saeki, Minoru Kawahara, Hirohisa Aman,
- Abstract要約: 最寄りのフレームワークは、Large Language Models (LLM) と Visual Language Models (VLM) を含む様々なアプリケーションのための基本的なツールである。
この情報は、インバージョンやメンバシップ攻撃などのセキュリティリスクにつながる。
PPPQ-ANN(Privacy- Preserving Product-Quantization Approximate Nearest Neighbor)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A nearest-neighbor framework is a fundamental tool for various applications involving Large Language Models (LLMs) and Visual Language Models (VLMs). Vectors used for nearest-neighbor searches have richer information for similarity searches. This information leads to security risks, such as embedding inversion and membership attacks. Therefore, Privacy-Preserving Approximate Nearest-Neighbor (PP-ANN) approaches are necessary for highly confidential data. However, conventional PP-ANN approaches based on a Trusted Execution Environment (TEE) or Fully Homomorphic Encryption (FHE) do not achieve practical security or performance. Additionally, conventional approaches focus on the search process rather than database generation for nearest-neighbor. To address these issues, we propose a Privacy-Preserving Product-Quantization Approximate Nearest Neighbor (PPPQ-ANN) framework. PPPQ-ANN provides a multi-layered security structure for vectors based on a hybrid of FHE and TEE. Additionally, PPPQ-ANN minimizes FHE ciphertext computations by combining Product-Quantization (PQ) with optimized data packing. We demonstrate the performance of PPPQ-ANN on million-scale datasets. As a result, PPPQ-ANN achieves database generation in less than 2 hours and more than 50 QPS in a sequential search while preserving privacy. Therefore, PPPQ-ANN optimizes the trade-off between security and performance by utilizing a hybrid of FHE and TEE, achieving practical performance while preserving privacy.
- Abstract(参考訳): 最寄りのフレームワークは、LLM(Large Language Models)とVLM(Visual Language Models)を含む様々なアプリケーションのための基本的なツールである。
最寄りの検索に使用されるベクトルは、類似検索のためによりリッチな情報を持つ。
この情報は、インバージョンやメンバシップ攻撃などのセキュリティリスクにつながる。
したがって、機密性の高いデータには、プライバシ保護の近似Nearest-Neighbor(PP-ANN)アプローチが必要である。
しかし、信頼された実行環境(TEE)や完全同型暗号化(FHE)に基づく従来のPP-ANNアプローチは、実際のセキュリティや性能を達成できない。
さらに, 従来の手法は, 最寄りのデータベース生成よりも, 検索プロセスに重点を置いている。
これらの課題に対処するため,プライバシ保護製品品質評価近似Nearest Neighbor (PPPQ-ANN) フレームワークを提案する。
PPPQ-ANNは、FHEとTEEのハイブリッドに基づいて、ベクトルのための多層セキュリティ構造を提供する。
さらに、PPPQ-ANNは、PQ(Product-Quantization)と最適化されたデータパッキングを組み合わせることで、FHE暗号の計算を最小化する。
百万規模のデータセット上でのPPPQ-ANNの性能を示す。
その結果、PPPQ-ANNは、プライバシを保ちながらシーケンシャル検索において、データベース生成を2時間未満で50QPS以上で達成する。
したがって、PPPQ-ANNは、FHEとTEEのハイブリッドを利用してセキュリティとパフォーマンスのトレードオフを最適化し、プライバシを保ちながら実用的なパフォーマンスを実現する。
関連論文リスト
- PAnDA: Rethinking Metric Differential Privacy Optimization at Scale with Anchor-Based Approximation [7.889420673572309]
我々は,距離微分プライバシー(mDP)のためのスケーラブルなフレームワークとして,アンカーベース分散近似(PAnDA)による摂動を提案する。
実世界の位置情報データセットの実験により、PAnDAは最大5,000レコードの秘密ドメインにスケールすることを示した。
論文 参考訳(メタデータ) (2025-09-10T16:14:08Z) - Towards Efficient Privacy-Preserving Machine Learning: A Systematic Review from Protocol, Model, and System Perspectives [11.859194469912083]
暗号化プロトコルに基づくプライバシ保護機械学習(PPML)は、クラウドベースの機械学習サービスにおいて、ユーザのデータプライバシを保護するための有望なパラダイムとして登場した。
PPMLは、大きなオーバヘッドのオーバヘッドのために、しばしば大幅な効率とスケーラビリティのコストを発生させる。
論文 参考訳(メタデータ) (2025-07-19T07:45:39Z) - Differentially Private Conformal Prediction via Quantile Binary Search [0.0]
我々は、P-COQS(Quantile Search)を介してプライベート・コンフォーマルティ(Private Conformity)と呼ぶ一般のDP手法を提案する。
提案手法は,CP のキャリブレーションフェーズにおけるDP量子化の計算に,既存のランダム化二値探索アルゴリズムを適用し,それに伴う予測セットのプライバシを保証する。
我々は,従来の代替手段と比較して,プライバシーノイズ,サンプルサイズ,重要度がアプローチの性能に与える影響について広範な実験を行った。
論文 参考訳(メタデータ) (2025-07-15T22:08:02Z) - Efficient Full-Stack Private Federated Deep Learning with Post-Quantum Security [17.45950557331482]
フェデレートラーニング(FL)は、データをローカルに保つことによって、ユーザのデータプライバシを保護しながら、協調的なモデルトレーニングを可能にする。
このようなアドバンテージにもかかわらず、FLはトレーニングやデプロイメント中のユーザの更新やモデルパラメータに対するプライバシ攻撃に弱いままである。
私たちは、ポストクォータムセキュアアグリゲーションを提供する新しいフレームワークであるBeskarを紹介します。
論文 参考訳(メタデータ) (2025-05-09T03:20:48Z) - Convergent Differential Privacy Analysis for General Federated Learning: the $f$-DP Perspective [57.35402286842029]
フェデレートラーニング(Federated Learning, FL)は、ローカルプライバシを重視した効率的な協調トレーニングパラダイムである。
ディファレンシャルプライバシ(DP)は、私的保護の信頼性を捕捉し、保証するための古典的なアプローチである。
論文 参考訳(メタデータ) (2024-08-28T08:22:21Z) - PriRoAgg: Achieving Robust Model Aggregation with Minimum Privacy Leakage for Federated Learning [49.916365792036636]
フェデレートラーニング(FL)は、大規模分散ユーザデータを活用する可能性から、最近大きな勢いを増している。
送信されたモデル更新は、センシティブなユーザ情報をリークする可能性があり、ローカルなトレーニングプロセスの集中的な制御の欠如は、モデル更新に対する悪意のある操作の影響を受けやすいグローバルモデルを残します。
我々は、Lagrange符号化計算と分散ゼロ知識証明を利用した汎用フレームワークPriRoAggを開発し、集約されたプライバシを満たすとともに、幅広いロバストな集約アルゴリズムを実行する。
論文 参考訳(メタデータ) (2024-07-12T03:18:08Z) - Share Secrets for Privacy: Confidential Forecasting with Vertical Federated Learning [5.584904689846748]
主な課題は、トレーニングと推論の両方において、データのプライバシと、小さくノイズの多いデータセットへの過度な適合である。
VFL' (STV) を用いたシークレット共有時系列予測を提案する。
その結果,STVの予測精度は集中型アプローチに匹敵することがわかった。
論文 参考訳(メタデータ) (2024-05-31T12:27:38Z) - A Survey of Secure Computation Using Trusted Execution Environments [80.58996305474842]
本稿では、TEEベースのセキュアな計算プロトコルの体系的なレビューと比較を行う。
まず、セキュアな計算プロトコルを3つの主要なカテゴリ、すなわち、セキュアなアウトソース計算、セキュアな分散計算、セキュアなマルチパーティ計算に分類する分類法を提案する。
これらの基準に基づき,汎用計算関数と特殊目的計算の両方に対して,最先端のTEEベースのセキュアな計算プロトコルを検証,検討し,比較する。
論文 参考訳(メタデータ) (2023-02-23T16:33:56Z) - Nearly Optimal Latent State Decoding in Block MDPs [74.51224067640717]
エピソードブロック MDP では、意思決定者は少数の潜在状態から生成される豊富な観測やコンテキストにアクセスすることができる。
まず、固定動作ポリシーに基づいて生成されたデータに基づいて、潜時状態復号関数を推定することに興味がある。
次に、報酬のないフレームワークにおいて、最適に近いポリシーを学習する問題について研究する。
論文 参考訳(メタデータ) (2022-08-17T18:49:53Z) - User-Level Privacy-Preserving Federated Learning: Analysis and
Performance Optimization [77.43075255745389]
フェデレートラーニング(FL)は、データを有用なモデルにトレーニングしながら、モバイル端末(MT)からプライベートデータを保存することができる。
情報理論の観点からは、MTがアップロードした共有モデルから、好奇心の強いサーバがプライベートな情報を推測することが可能である。
サーバにアップロードする前に、共有モデルに人工ノイズを加えることで、ユーザレベルの差分プライバシー(UDP)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-29T10:13:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。