論文の概要: WHET: Welding Homomorphic Encryption to Accelerator Architectures
- arxiv url: http://arxiv.org/abs/2606.11541v1
- Date: Wed, 10 Jun 2026 01:04:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 14:51:13.168657
- Title: WHET: Welding Homomorphic Encryption to Accelerator Architectures
- Title(参考訳): WHET: アクセラレータアーキテクチャへの同型暗号化の溶接
- Authors: Jongmin Kim, Hyesung Ji, Wonseok Choi, Hyunah Yu, Jung Ho Ahn,
- Abstract要約: ホモモルフィック暗号化(英語版) (FHE) は復号化せずに暗号化されたデータの計算を可能にする。
それまでの取り組みは、暗号とアルゴリズムの強化やハードウェアアクセラレーションを通じて、FHEのパフォーマンスを着実に改善してきた。
メモリ中心のアーキテクチャを意識した最適化を導入し、暗号とアルゴリズムの構成をFHEアクセラレータアーキテクチャと整合させる。
- 参考スコア(独自算出の注目度): 3.4027459785553
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fully homomorphic encryption (FHE) enables computations on encrypted data without decryption, offering strong data privacy at the expense of substantial computational and memory overheads. Prior efforts have steadily improved FHE performance through cryptographic and algorithmic enhancements or hardware acceleration, yet these two directions have progressed largely in isolation, hindering the full exploitation of available hardware capabilities. This work presents WHET, which introduces memory-centric, architecture-aware optimizations to better align cryptographic and algorithmic constructions with FHE accelerator architectures. We identify conventional FHE constructions as major sources of excessive working sets and heavy off-chip memory traffic. We propose accelerator-specific techniques, including fine-grained coefficient-to-slot transformation, plaintext compression, and intermediate modulus raising, to reduce the on-chip data footprint by minimizing temporary ciphertexts and plaintext loads. With these techniques applied, we observe additional opportunities to improve on-chip memory efficiency; hence, we introduce lightweight architectural refinements, including a special-purpose buffer and functional unit extensions. With these optimizations, WHET achieves 1.38-8.74$\times$ per-area performance improvements over state-of-the-art FHE accelerators and the first-ever sub-millisecond CKKS bootstrapping.
- Abstract(参考訳): 完全同型暗号化(FHE)は、復号化せずに暗号化されたデータの計算を可能にし、計算とメモリのオーバーヘッドを犠牲にして強力なデータプライバシを提供する。
それまでの取り組みでは、暗号化とアルゴリズムの強化、あるいはハードウェアアクセラレーションを通じて、FHEのパフォーマンスを着実に改善してきたが、これら2つの方向は独立して進行し、利用可能なハードウェア機能を完全に利用できなくなった。
この研究は、メモリ中心のアーキテクチャを意識した最適化を導入し、暗号とアルゴリズムの構造をFHEアクセラレータアーキテクチャと整合させるWHETを紹介している。
我々は、従来のFHE構造を、過剰な作業セットと重いオフチップメモリトラフィックの主な情報源とみなす。
本研究では, 一時的暗号文と平文負荷を最小限に抑え, チップ上のデータフットプリントを削減するために, 微粒化係数-スロット変換, 平文圧縮, 中間率上昇など, 加速器固有の手法を提案する。
これらの技術を適用して、オンチップメモリ効率を改善するための追加の機会を観察し、特殊目的バッファや機能単位拡張を含む軽量なアーキテクチャ改善を導入する。
これらの最適化により、WHETは1.38-8.74$\times$ per-areaパフォーマンスの改善を、最先端のFHEアクセラレータと最初のサブミリ秒CKKSブートストラップで達成した。
関連論文リスト
- Design of Memristive Lightweight Encryption For In-Memory Image Steganography [0.0]
本稿では,CIMのための標準軽量ストリーム暗号であるTriviumとGrain-128aを実装した。
これらの暗号のレジスタに提案したデータシフト法を適用すると、計算ステップの数を減らし、それぞれ42%と44%のエネルギー消費を削減できる。
論文 参考訳(メタデータ) (2026-05-05T08:33:25Z) - AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization [84.25316984309725]
動的スパース構造とパラメータ効率のよいアダプタ(例えばLoRA)の統合は、大規模言語モデル(LLM)を拡張するための強力な技術である。
計算負荷は最小限に抑えられるが、計算のレイテンシが急上昇し、復号速度が2.5倍以上遅くなる。
AdaFuseはアルゴリズムと基盤となるハードウェアシステムとの緊密な協調設計に基づいて構築されたフレームワークで、効率的な動的アダプタ実行を実現する。
論文 参考訳(メタデータ) (2026-03-12T12:46:42Z) - BitStopper: An Efficient Transformer Attention Accelerator via Stage-fusion and Early Termination [14.53308613746613]
BitStopperは、粒度の細かいアルゴリズムアーキテクチャの共設計で、スパーシティ予測器を使わずに動作する。
サンガーとSOFAの2.03倍と1.89倍のスピードアップを実現し、エネルギー効率は2.4倍と2.1倍向上した。
論文 参考訳(メタデータ) (2025-12-06T14:44:38Z) - Decoder-Hybrid-Decoder Architecture for Efficient Reasoning with Long Generation [108.0657508755532]
我々は、レイヤ間の効率的なメモリ共有のためのシンプルで効果的なメカニズムであるGated Memory Unit(GMU)を紹介した。
これは、GMUを組み込んでSambaベースのセルフデコーダからメモリ読み出し状態を共有するデコーダ・ハイブリッド・デコーダアーキテクチャである。
論文 参考訳(メタデータ) (2025-07-09T07:27:00Z) - EFFACT: A Highly Efficient Full-Stack FHE Acceleration Platform [15.3973190088728]
EFFACTは、包括的な最適化とベクターフレンドリなハードウェアを提供するコンパイラを備えた、非常に効率的なフルスタックFHEアクセラレーションプラットフォームである。
EFFACTにはISAとコンパイラバックエンドがあり、CKKS、BGV、BFVなどのFHEスキームをサポートする。
論文 参考訳(メタデータ) (2025-04-22T12:01:20Z) - CIPHERMATCH: Accelerating Homomorphic Encryption-Based String Matching via Memory-Efficient Data Packing and In-Flash Processing [8.114331115730021]
ホモモルフィック暗号化(HE)は、元のデータを公開せずに暗号化されたデータのセキュアな計算を可能にする。
多くのクラウドコンピューティングアプリケーション(例えば、DNA読み取りマッピング、バイオメトリックマッチング、Web検索)は、正確な文字列マッチングをキー操作として使っている。
ホモモルフィック暗号を用いた従来の文字列マッチングアルゴリズムは、高い計算遅延によって制限される。
論文 参考訳(メタデータ) (2025-03-12T00:25:58Z) - FHEmem: A Processing In-Memory Accelerator for Fully Homomorphic Encryption [9.884698447131374]
ホモモルフィック暗号化(英: Homomorphic Encryption、FHE)は、暗号化データ上で任意の計算を復号化せずに実行できる技術である。
FHEは、暗号化後のデータサイズの増加により、普通のデータの計算よりも大幅に遅い。
PIMベースのFHEアクセラレータFHEmemを提案する。
論文 参考訳(メタデータ) (2023-11-27T20:11:38Z) - Practical Conformer: Optimizing size, speed and flops of Conformer for
on-Device and cloud ASR [67.63332492134332]
我々は、デバイス上の制約を満たすのに十分小さく、TPUを高速に推論できる最適化されたコンバータを設計する。
提案するエンコーダは、デバイス上では強力なスタンドアロンエンコーダとして、また高性能なASRパイプラインの第1部として利用することができる。
論文 参考訳(メタデータ) (2023-03-31T23:30:48Z) - EfficientFCN: Holistically-guided Decoding for Semantic Segmentation [49.27021844132522]
最先端セマンティックセマンティックセグメンテーションアルゴリズムは主に拡張されたFully Convolutional Networks (DilatedFCN)に基づいている
本稿では,拡張畳み込みのないイメージネット事前学習ネットワークをバックボーンとする,効率的なFCNを提案する。
このようなフレームワークは、計算コストの1/3しか持たない最先端の手法に比べて、同等またはそれ以上の性能を達成する。
論文 参考訳(メタデータ) (2020-08-24T14:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。