論文の概要: Private Embedding Lookup with Encrypted Compact Queries under Fully Homomorphic Encryption
- arxiv url: http://arxiv.org/abs/2606.03191v3
- Date: Sun, 07 Jun 2026 11:00:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:04.868496
- Title: Private Embedding Lookup with Encrypted Compact Queries under Fully Homomorphic Encryption
- Title(参考訳): 完全同型暗号化下での暗号化された小型クエリによるプライベートな埋め込み検索
- Authors: Jung Hee Cheon, Daehyun Jang, Jaehee Kang, Hanee Rhee,
- Abstract要約: ホモモルフィック暗号化(FHE)は、暗号化されたクライアントデータに対する推論を可能にするが、埋め込みルックアップを単純なテーブルアクセスからホモモルフィックな計算に変換する。
本稿では,サーバ側への埋め込みを継続し,クライアントから暗号化された埋め込みベクタの送信を回避するために,Independent Vector Evaluation (IVE)を提案する。
提案手法は,従来の手法に比べて最大78.4倍のアモータイズされたルックアップ時間を向上することを示す。
- 参考スコア(独自算出の注目度): 6.905410946758494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many NLP or recommendation models begin by mapping discrete client inputs to embedding vectors. Since inputs can reveal sensitive information, the embedding step must be protected in privacy-preserving inference. Fully Homomorphic Encryption (FHE) enables inference over encrypted client data, but turns embedding lookup from simple table access into homomorphic computation. To keep the embedding table server-side and avoid transmitting encrypted embedding vectors from the client, we focus on server-side lookup: the client sends only a small encrypted index. Prior ICML 2024 work first builds a one-hot vector from the encrypted index before multiplying with the embedding table, and this one-hot generation is the dominant cost. One-hot-based methods are expensive in FHE: they construct a p-dimensional selection vector via an equality test for each coordinate, requiring $O(p \log p)$ total homomorphic operations. Our key observation is that private embedding lookup only requires a linearly independent representation of the encrypted index, not the one-hot basis itself. Building on it, we propose Independent Vector Evaluation (IVE). Instead of constructing a one-hot vector, IVE evaluates a linearly independent vector built from successive powers of a single encrypted value, reducing vector-generation cost to $O(p)$. It then recovers the same embedding vector via a precomputed change of basis, instantiated with an orthogonal Discrete Cosine Transform to mitigate error amplification. Our implementation shows IVE improves amortized lookup time by up to 78.4x over prior method. We further evaluate its impact on end-to-end encrypted FastText inference, where embedding lookup is a major cost in the shallow model. On Enron-Spam dataset, replacing one-hot generation with IVE reduces the share of vector generation in encrypted inference time from 99.6% to 66.3%.
- Abstract(参考訳): 多くのNLPまたはレコメンデーションモデルは、個別のクライアント入力を埋め込みベクトルにマッピングすることから始まる。
入力は機密情報を明らかにすることができるため、埋め込みステップはプライバシー保護推論で保護されなければならない。
完全同型暗号化(FHE)は、暗号化されたクライアントデータに対する推論を可能にするが、埋め込みルックアップを単純なテーブルアクセスから同型計算に変換する。
埋め込みテーブルをサーバ側で保持し、暗号化された埋め込みベクトルをクライアントから送信するのを避けるため、サーバ側で検索する:クライアントは小さな暗号化インデックスのみを送信する。
ICML 2024以前の作業では、埋め込みテーブルにマージする前に暗号化されたインデックスからワンホットベクトルを最初に構築し、このワンホット生成が主なコストである。
一点法は FHE において高価であり、各座標に対する等式テストによって p-次元選択ベクトルを構築し、$O(p \log p)$全同型演算を必要とする。
我々のキーとなる観察は、プライベートな埋め込みルックアップは1ホットベース自体ではなく、暗号化されたインデックスの線形独立表現のみを必要とすることである。
そこで我々は独立ベクトル評価(IVE)を提案する。
1ホットベクトルを構築する代わりに、IVEは1つの暗号化された値の連続的なパワーから構築された線形独立ベクトルを評価し、ベクトル生成コストを$O(p)$に削減する。
その後、基底の事前計算による埋め込みベクトルを復元し、直交離散コサイン変換でインスタンス化し、エラー増幅を緩和する。
提案手法は,従来の手法に比べて最大78.4倍のアモータイズされたルックアップ時間を向上することを示す。
組込みルックアップが浅層モデルにおいて大きなコストとなるような,エンドツーエンドの暗号化FastText推論への影響をさらに評価する。
Enron-Spamデータセットでは、ワンホット生成をIVEに置き換えることで、暗号化された推論時間のベクトル生成のシェアを99.6%から66.3%に削減する。
関連論文リスト
- No More K-means: Single-Stage Sparse Coding for Efficient Multi-Vector Retrieval [51.43543998583709]
SSR(Single-stage Sparse Retrieval)は、高価なクラスタリングを効率的なスパースコーディングに置き換えるパラダイムシフトである。
ColBERTv2と比較してインデックス処理時間を15倍短縮し、検索レイテンシを半減させ、同時に検索性能を向上させる。
論文 参考訳(メタデータ) (2026-05-28T15:53:34Z) - HE-LRM: Encrypted Deep Learning Recommendation Models using Fully Homomorphic Encryption [3.0841649700901117]
FHE(Fully Homomorphic Encryption)は、データを暗号化するだけでなく、暗号化されたデータに直接計算を適用することができる暗号化方式である。
本稿では,FHEを深層学習勧告モデル(DLRM)に適用する際の課題と機会について考察する。
本研究では,FHE計算コストを低減し,基礎となるモデル性能を維持しつつ,圧縮埋込みルックアップを実行する新しい手法を開発した。
論文 参考訳(メタデータ) (2025-06-22T19:40:04Z) - Encrypted Vector Similarity Computations Using Partially Homomorphic Encryption: Applications and Performance Analysis [0.0]
部分同型暗号(PHE)を用いて暗号化されたコサイン類似性を計算可能であることを示す。
PHEは計算集約性が少なく、高速で、より小さな暗号文/鍵を生成する。
結果は、PHEがメモリ制限された環境と現実世界のプライバシー保護暗号化類似性検索に適していることを示している。
論文 参考訳(メタデータ) (2025-03-07T09:52:16Z) - GEC-DePenD: Non-Autoregressive Grammatical Error Correction with
Decoupled Permutation and Decoding [52.14832976759585]
文法的誤り訂正(GEC)は、通常自己回帰的なシーケンス・ツー・シーケンスモデルで解決される重要なNLPタスクである。
本稿では, アーキテクチャを置換ネットワークに分離する, GEC に対する非自己回帰的アプローチを提案する。
GECの既知の非自己回帰手法よりもネットワークが向上することを示す。
論文 参考訳(メタデータ) (2023-11-14T14:24:36Z) - Vcc: Scaling Transformers to 128K Tokens or More by Prioritizing
Important Tokens [65.4435926060951]
本稿では,超長周期の変換器の効率を,各層でより小さな表現に圧縮することで向上することを提案する。
我々のアルゴリズムは効率的であるだけでなく(4Kと16Kのベースラインに比べて3倍以上の効率向上を達成する)、多数のタスクで競合/ベターパフォーマンスを提供する。
論文 参考訳(メタデータ) (2023-05-07T10:32:18Z) - HEFT: Homomorphically Encrypted Fusion of Biometric Templates [20.10175446213924]
完全同相暗号(FHE)を用いたバイオメトリックテンプレートの安全な融合とマッチングのための非インタラクティブ解を提案する。
HEFTと呼ばれるこの手法は、FHEが課すユニークな制約、すなわち非算術演算に対する計算サポートの欠如を克服するためにカスタム設計されている。
テンプレート融合実験により, HEFT (i) による生体認証性能の11.07%, AUROCの9.58%向上が確認された。
論文 参考訳(メタデータ) (2022-08-15T14:55:08Z) - THE-X: Privacy-Preserving Transformer Inference with Homomorphic
Encryption [112.02441503951297]
トランスフォーマーモデルのプライバシ保護推論は、クラウドサービスユーザの要求に基づいています。
我々は、事前訓練されたモデルのプライバシ保存推論を可能にするトランスフォーマーの近似アプローチである$textitTHE-X$を紹介した。
論文 参考訳(メタデータ) (2022-06-01T03:49:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。