論文の概要: EncFormer: Secure and Efficient Transformer Inference over Encrypted Data
- arxiv url: http://arxiv.org/abs/2604.09975v1
- Date: Sat, 11 Apr 2026 01:15:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.774368
- Title: EncFormer: Secure and Efficient Transformer Inference over Encrypted Data
- Title(参考訳): EncFormer:暗号化データに対するセキュアで効率的なトランスフォーマー推論
- Authors: Yufan Zhu, Chao Jin, Khin Mi Mi Aung, Xiaokui Xiao,
- Abstract要約: マシンラーニング・アズ・ア・サービス(MLas-a-service)におけるトランスフォーマー推論は、センシティブなユーザ入力に対するプライバシー上の懸念を提起する。
EncFormerは、Stage Compatible Patternsを導入した、サードパーティのプライベートトランスフォーマー推論フレームワークである。
本稿では,従来のハイブリッドFHE-MPCシステムに対して,オンラインMPC通信の1.4x-30.4x,エンド・ツー・エンドの1.3x-9.8xを実現していることを示す。
- 参考スコア(独自算出の注目度): 21.63908755417832
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transformer inference in machine-learning-as-a-service (MLaaS) raises privacy concerns for sensitive user inputs. Prior secure solutions that combine fully homomorphic encryption (FHE) and secure multiparty computation (MPC) are bottlenecked by inefficient FHE kernels, communication-heavy MPC protocols, and expensive FHE-MPC conversions. We present EncFormer, a two-party private Transformer inference framework that introduces Stage Compatible Patterns so that FHE kernels compose efficiently, reducing repacking and conversions. EncFormer also provides a cost analysis model built around a minimal-conversion baseline, enabling principled selection of FHE-MPC boundaries. To further reduce communication, EncFormer proposes a secure complex CKKS-MPC conversion protocol and designs communication-efficient MPC protocols for nonlinearities. With GPU optimizations, evaluations on GPT- and BERT-style models show that EncFormer achieves 1.4x-30.4x lower online MPC communication and 1.3x-9.8x lower end-to-end latency against prior hybrid FHE-MPC systems, and 1.9x-3.5x lower end-to-end latency on BERT-base than FHE-only pipelines under a matched backend, while maintaining near-plaintext accuracy on selected GLUE tasks.
- Abstract(参考訳): 機械学習・アズ・ア・サービス(MLaaS)におけるトランスフォーマー推論は、機密性の高いユーザ入力に対するプライバシー上の懸念を提起する。
完全ホモモルフィック暗号化(FHE)とセキュアマルチパーティ計算(MPC)を組み合わせた事前セキュアなソリューションは、非効率なFHEカーネル、通信量の多いMPCプロトコル、高価なFHE-MPC変換によってボトルネックとなる。
本稿では、FHEカーネルが効率的に構成できるようにStage Compatible Patternsを導入し、再パッケージ化と変換を削減した、サードパーティのプライベートトランスフォーマー推論フレームワークであるEncFormerを紹介する。
EncFormerはまた、最小限の変換ベースラインを中心に構築されたコスト分析モデルを提供し、FHE-MPC境界の原則的選択を可能にする。
EncFormerは、通信をさらに削減するために、安全な複雑なCKKS-MPC変換プロトコルを提案し、非線形性のための通信効率の良いMPCプロトコルを設計する。
GPU最適化では、GPTとBERTスタイルのモデルで、EncFormerはオンラインMPC通信の1.4x-30.4x、従来のハイブリッドFHE-MPCシステムに比べて1.3x-9.8x、BERTベースでは1.9x-3.5x、マッチしたバックエンド下でのFHEのみのパイプラインよりも1.9x-3.5xのエンド・ツー・エンドのレイテンシを実現し、選択されたGLUEタスクの近テキスト精度を維持している。
関連論文リスト
- GLM-OCR Technical Report [65.42028025507491]
GLM-OCRは実世界の文書理解のために設計された効率的なコンパクトモデルである。
CogViTビジュアルエンコーダとGLM言語デコーダを組み合わせることで、計算効率と認識性能のバランスが強い。
公開ベンチマークと産業シナリオの大規模な評価は、GLM-OCRが競争力や最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2026-03-11T15:55:47Z) - HHEML: Hybrid Homomorphic Encryption for Privacy-Preserving Machine Learning on Edge [4.623074730653607]
プライバシ保護機械学習(PPML)は、信頼できない環境で機密データに対するセキュアな機械学習推論を処理するための、新たなトピックである。
完全同型暗号化(FHE)は、サーバ側の暗号化データ上で直接計算を可能にするが、クライアント側の重要な通信と計算オーバーヘッドを導入する。
HHEは、クライアント側の計算コストを削減するために、対称暗号(SE)とFHEを組み合わせることで、この制限に対処する。
本研究は、FHE互換に最適化された軽量対称暗号を中心に構築されたハードウェアアクセラレーションHHEアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-10-23T05:51:55Z) - Breaking the Layer Barrier: Remodeling Private Transformer Inference with Hybrid CKKS and MPC [16.452180247201948]
本稿では,同型暗号化(HE)とセキュアマルチパーティ計算(MPC)を組み合わせてデータプライバシ保護を行う,プライベートトランスフォーマー推論のための効率的なフレームワークを提案する。
BLBと呼ばれる提案されたフレームワークは、層をきめ細かな演算子に分解し、隣接する線形演算子をさらに融合することでこれを克服し、HE/MPC変換の必要性を低減している。
BLB は BOLT (S&P'24) と比較して通信オーバーヘッドを 21 時間削減し、Bumblebee (NDSS'25) よりも 2 時間削減し、レイテンシーを 13 時間短縮し 1.8 ドルを達成する。
論文 参考訳(メタデータ) (2025-08-27T02:40:50Z) - Accelerating Private Large Transformers Inference through Fine-grained Collaborative Computation [8.859237832459876]
FASTLMPIは、微粒な最適化により、プライベートなTBM推論を高速化する新しい手法である。
具体的には、ホモモルフィック暗号化と秘密共有の詳細な共設計により、FASTLMPIは行列乗算、SoftMax、LayerNorm、GeLULUの効率的なプロトコルを実現する。
FASTLMPIは、実行時の54%から64%の大幅な減少と、通信コストの72.2%の大幅な削減を示している。
論文 参考訳(メタデータ) (2024-12-21T08:33:12Z) - Ditto: Quantization-aware Secure Inference of Transformers upon MPC [5.161569981377991]
我々は、より効率的な量子化対応セキュアトランスフォーマー推論を実現するために、Dittoというフレームワークを提案する。
本稿では,Bert モデルと GPT2 モデルを用いて,Ditto の性能評価を行う。
その結果、DittoはMPCFormerより約$3.14sim 4.40times、最先端のPUMAより$1.44sim 2.35timesが速いことがわかった。
論文 参考訳(メタデータ) (2024-05-09T03:28:16Z) - Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - Towards Semantic Communication Protocols: A Probabilistic Logic
Perspective [69.68769942563812]
我々は,NPMを確率論理型言語ProbLogで記述された解釈可能なシンボルグラフに変換することによって構築された意味プロトコルモデル(SPM)を提案する。
その解釈性とメモリ効率を利用して、衝突回避のためのSPM再構成などのいくつかの応用を実演する。
論文 参考訳(メタデータ) (2022-07-08T14:19:36Z) - Covert Model Poisoning Against Federated Learning: Algorithm Design and
Optimization [76.51980153902774]
フェデレーテッド・ラーニング(FL)はパラメータ伝達中にFLモデルに対する外部攻撃に対して脆弱である。
本稿では,最先端の防御アグリゲーション機構に対処する有効なMPアルゴリズムを提案する。
実験の結果,提案したCMPアルゴリズムは,既存の攻撃機構よりも効果的で,かなり優れていることが示された。
論文 参考訳(メタデータ) (2021-01-28T03:28:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。