論文の概要: Triple-Hoisted Baby-Step Giant-Step Linear Transformation over CKKS Homomorphic Encryption and Hardware Accelerator
- arxiv url: http://arxiv.org/abs/2605.17222v1
- Date: Sun, 17 May 2026 01:57:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.739284
- Title: Triple-Hoisted Baby-Step Giant-Step Linear Transformation over CKKS Homomorphic Encryption and Hardware Accelerator
- Title(参考訳): CKKSホモモルフィック暗号化とハードウェアアクセラレータによる三重ホスティングベイビーステップジャイアントステップ線形変換
- Authors: Sajjad Akherati, Xinmiao Zhang,
- Abstract要約: ホモモルフィック暗号化(HE)は、プライバシ保護のクラウドコンピューティングには不可欠である。
線形変換は、大きな言語モデルを含むニューラルネットワークで広く使われている。
本稿では, CKKS HE評価に必要な暗号文の回転回数を大幅に削減するために, ベビーステップを分解する3重ホスティング・ベビーステップ・ジャイアントステップアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 3.050919759387984
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computations can be directly carried out over ciphertexts using homomorphic encryption (HE), which is indispensable for privacy-preserving cloud computing. Linear transformation is widely used in neural networks, including large language models. However, the implementation of linear transformation over HE requires a large number of ciphertext rotations, which incur significant memory and hardware overhead despite existing simplification techniques. This paper proposes a triple-hoisted baby-step giant-step algorithm that decomposes the baby step further to substantially reduce the number of ciphertext rotations needed for the CKKS HE evaluation of linear transformation. Moreover, to reduce off-chip memory access, which contributes to the majority of the latency, a memory-optimized data path is proposed by partitioning the algorithm into multiple phases. Furthermore, an efficient FPGA-based hardware accelerator with an optimized permutation circuit for message routing is designed for the proposed scheme. For a set of typical parameters, the proposed design reduces the off-chip memory access by 2.9x compared to the best prior design. Synthesized for Xilinx Virtex UltraScale+ devices, the proposed design achieves a 5.8x reduction in computational latency compared with the baseline design.
- Abstract(参考訳): 計算はホモモルフィック暗号化(HE)を使用して暗号文上で直接行うことができ、これはプライバシ保護のクラウドコンピューティングには不可欠である。
線形変換は、大きな言語モデルを含むニューラルネットワークで広く使われている。
しかし、HE上の線形変換の実装には多数の暗号文回転が必要であり、既存の単純化技術にもかかわらず、メモリとハードウェアのオーバーヘッドが大幅に増大する。
本稿では, CKKS HEの線形変換評価に必要な暗号文の回転回数を大幅に削減するために, ベビーステップを分解する3重ホスティング・ベビーステップ・ジャイアントステップアルゴリズムを提案する。
さらに,遅延の大部分に寄与するオフチップメモリアクセスを低減するために,複数のフェーズに分割してメモリ最適化データパスを提案する。
さらに,提案方式のために,メッセージルーティングに最適化された置換回路を備えたFPGAベースのハードウェアアクセラレータを設計した。
典型的なパラメータの集合に対して、提案した設計は、最良設計に比べてオフチップメモリアクセスを2.9倍削減する。
Xilinx Virtex UltraScale+ デバイス向けに合成された提案設計は,ベースライン設計と比較して計算遅延の5.8倍の低減を実現している。
関連論文リスト
- Orthogonal Finetuning Made Scalable [92.34573849209238]
OFT(Orthogonal Finetuning)は、壊滅的な忘れ込みを防止しつつ、パラメータ効率の高い適応を提供するが、実行時とメモリの要求が高いため、実際のデプロイメントが制限される。
ここでは,OFTの計算ボトルネックを重み中心の実装とみなす。
本稿では,行列ベクトル乗法(行列フリー計算)を用いて,計算コストを2次に削減する入力中心の変換法OFTv2を提案する。
これらの変更により、OFTv2は最大10倍の高速トレーニングと3倍のGPUメモリ使用率を達成することができる。
論文 参考訳(メタデータ) (2025-06-24T17:59:49Z) - 3DGS Compression with Sparsity-guided Hierarchical Transform Coding [19.575833741231953]
SHTC(Sparsity-guided Hierarchical Transform Coding)は、3DGS圧縮のためのエンドツーエンドのトランスフォーメーションコーディングフレームワークである。
SHTCは3DGS、変換、軽量コンテキストモデルを共同で最適化している。
この新しい設計により、最小限の追加パラメータと計算オーバーヘッドでR-D性能が大幅に向上する。
論文 参考訳(メタデータ) (2025-05-28T22:17:24Z) - Fast correlated decoding of transversal logical algorithms [67.01652927671279]
大規模計算には量子エラー補正(QEC)が必要であるが、かなりのリソースオーバーヘッドが発生する。
近年の進歩により、論理ゲートからなるアルゴリズムにおいて論理キュービットを共同で復号化することにより、症候群抽出ラウンドの数を削減できることが示されている。
ここでは、回路を介して伝播する関連する論理演算子製品を直接復号することで、回路の復号化の問題を修正する。
論文 参考訳(メタデータ) (2025-05-19T18:00:00Z) - GDNTT: an Area-Efficient Parallel NTT Accelerator Using Glitch-Driven Near-Memory Computing and Reconfigurable 10T SRAM [14.319119105134309]
本稿では、グリッチ駆動ニアメモリコンピューティング(GDNTT)を用いた領域効率の高い高並列NTT加速器を提案する。
この設計はデータストレージ用の10Tを統合し、柔軟な行/列のデータアクセスと合理化回路マッピング戦略を可能にする。
評価の結果,提案したNTTアクセラレーターは,最先端技術と比較して1.528*のスループット向上を実現していることがわかった。
論文 参考訳(メタデータ) (2025-05-13T01:53:07Z) - CIPHERMATCH: Accelerating Homomorphic Encryption-Based String Matching via Memory-Efficient Data Packing and In-Flash Processing [8.114331115730021]
ホモモルフィック暗号化(HE)は、元のデータを公開せずに暗号化されたデータのセキュアな計算を可能にする。
多くのクラウドコンピューティングアプリケーション(例えば、DNA読み取りマッピング、バイオメトリックマッチング、Web検索)は、正確な文字列マッチングをキー操作として使っている。
ホモモルフィック暗号を用いた従来の文字列マッチングアルゴリズムは、高い計算遅延によって制限される。
論文 参考訳(メタデータ) (2025-03-12T00:25:58Z) - Variable-size Symmetry-based Graph Fourier Transforms for image compression [65.7352685872625]
可変サイズのグラフフーリエ変換を符号化フレームワークに導入する。
提案アルゴリズムは,ノード間の特定の対称接続を追加することにより,グリッド上の対称グラフを生成する。
実験により、SBGFTは、明示的な多重変換選択に統合された一次変換よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-24T13:00:44Z) - Accelerating Error Correction Code Transformers [56.75773430667148]
本稿では,トランスを用いたデコーダの高速化手法を提案する。
最新のハードウェアでは、90%の圧縮比を実現し、算術演算エネルギー消費を少なくとも224倍削減する。
論文 参考訳(メタデータ) (2024-10-08T11:07:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。