論文の概要: Code Generation for Cryptographic Kernels using Multi-word Modular Arithmetic on GPU
- arxiv url: http://arxiv.org/abs/2501.07535v1
- Date: Mon, 13 Jan 2025 18:15:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 17:24:46.582126
- Title: Code Generation for Cryptographic Kernels using Multi-word Modular Arithmetic on GPU
- Title(参考訳): GPU上での多ワードモジュラ算術を用いた暗号カーネルのコード生成
- Authors: Naifeng Zhang, Franz Franchetti,
- Abstract要約: 同型暗号(FHE)とゼロ知識証明(ZKP)が分散環境におけるデータセキュリティのソリューションとして出現している。
本稿では,Multi-word modular arithmetic (MoMA) の形式化を行い,大きなビット幅の整数演算を機械語上の演算に分解する。
- 参考スコア(独自算出の注目度): 0.5831737970661138
- License:
- Abstract: Fully homomorphic encryption (FHE) and zero-knowledge proofs (ZKPs) are emerging as solutions for data security in distributed environments. However, the widespread adoption of these encryption techniques is hindered by their significant computational overhead, primarily resulting from core cryptographic operations that involve large integer arithmetic. This paper presents a formalization of multi-word modular arithmetic (MoMA), which breaks down large bit-width integer arithmetic into operations on machine words. We further develop a rewrite system that implements MoMA through recursive rewriting of data types, designed for compatibility with compiler infrastructures and code generators. We evaluate MoMA by generating cryptographic kernels, including basic linear algebra subprogram (BLAS) operations and the number theoretic transform (NTT), targeting various GPUs. Our MoMA-based BLAS operations outperform state-of-the-art multi-precision libraries by orders of magnitude, and MoMA-based NTTs achieve near-ASIC performance on commodity GPUs.
- Abstract(参考訳): 分散環境におけるデータセキュリティのソリューションとして,完全同型暗号 (FHE) とゼロ知識証明 (ZKP) が出現している。
しかし、これらの暗号化技術が広く採用されることは、大きな整数演算を含むコア暗号演算によって、その計算オーバーヘッドの大きな障害となる。
本稿では,Multi-word modular arithmetic (MoMA) の形式化を行い,大きなビット幅の整数演算を機械語上の演算に分解する。
さらに,コンパイラやコードジェネレータとの互換性のために設計されたデータ型の再帰的書き換えにより,MoMAを実装した書き換えシステムを開発した。
我々は,基本線形代数サブプログラム (BLAS) 演算や数理論変換 (NTT) など,様々なGPUをターゲットにした暗号カーネルを生成することで,MoMAを評価する。
我々のMoMAベースのBLAS操作は、最先端のマルチ精度ライブラリを桁違いに上回り、MoMAベースのNTTはコモディティGPU上でほぼASICのパフォーマンスを達成する。
関連論文リスト
- Searching for Efficient Linear Layers over a Continuous Space of Structured Matrices [88.33936714942996]
アインシュタイン和を通じて表現可能なすべての線形作用素の探索を可能にする統一フレームワークを提案する。
計算-最適スケーリング法則の違いは主に少数の変数によって支配されていることを示す。
そこで,Mixture-of-Experts (MoE) は,注目ブロックの投影を含む,モデルのすべての線形層におけるMoEを学習する。
論文 参考訳(メタデータ) (2024-10-03T00:44:50Z) - A Method for Efficient Heterogeneous Parallel Compilation: A Cryptography Case Study [8.06660833012594]
本稿では,多様なハードウェアアーキテクチャにまたがるデータ管理と並列計算を最適化するために,ハイパーという新しいMLIRベースの方言を提案する。
HETOCompilerは,複数のハッシュアルゴリズムを実装し,不均一なシステム上での実行を可能にする,暗号に着目したコンパイラのプロトタイプである。
論文 参考訳(メタデータ) (2024-07-12T15:12:51Z) - BoostCom: Towards Efficient Universal Fully Homomorphic Encryption by Boosting the Word-wise Comparisons [14.399750086329345]
完全同型暗号化(FHE)は、最初に復号化することなく、暗号化データ上での計算の実行を可能にする。
本稿では,単語比較処理の高速化を目的としたBoostComを提案する。
我々は、最先端のCPUベースのuFHEシステムと比較して、桁違い(11.1倍高速)のエンドツーエンド性能向上を実現している。
論文 参考訳(メタデータ) (2024-07-10T02:09:10Z) - On efficient normal bases over binary fields [0.0]
バイナリフィールド拡張は、暗号、コードベースの暗号、エラー訂正コードの基本である。
本稿では,異なる範囲における演算の効率的な実装を示すために,$mathbbF_2n$ over $mathbbF$を探索する。
論文 参考訳(メタデータ) (2024-02-18T11:06:20Z) - Hybrid programming-model strategies for GPU offloading of electronic
structure calculation kernels [2.4898174182192974]
PROGRESSは電子構造解析のためのライブラリである。
電子構造カーネルに対する線形代数演算を実装している。
本稿では,これらの実装における汎用戦略について述べる。
論文 参考訳(メタデータ) (2024-01-24T19:38:01Z) - Tackling the Matrix Multiplication Micro-kernel Generation with Exo [0.5517652814152908]
新しいハードウェアごとに専用のマイクロカーネルを生成するためのステップバイステップの手順を提案する。
ハードウェアターゲットは、その命令の簡潔なライブラリベースの記述によって完全に指定されるため、生成したコードの移植性も向上する。
論文 参考訳(メタデータ) (2023-10-26T14:09:57Z) - CodeChain: Towards Modular Code Generation Through Chain of Self-revisions with Representative Sub-modules [51.82044734879657]
我々は,自己修正の連鎖を通じてモジュール化されたコード生成を誘発する,新しい推論フレームワークであるCodeChainを提案する。
CodeChainは、生成したソリューションのモジュール性と正確性の両方を大幅に向上させ、APPSで35%、CodeContestsで76%の相対パス@1の改善を実現しています。
論文 参考訳(メタデータ) (2023-10-13T10:17:48Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - High-performance symbolic-numerics via multiple dispatch [52.77024349608834]
Symbolics.jlは拡張可能なシンボルシステムで、動的多重ディスパッチを使用してドメインのニーズに応じて振る舞いを変更する。
実装に依存しないアクションでジェネリックapiを形式化することで、システムに最適化されたデータ構造を遡及的に追加できることを示します。
従来の用語書き換えシンプリファイアと電子グラフベースの用語書き換えシンプリファイアをスワップする機能を実証する。
論文 参考訳(メタデータ) (2021-05-09T14:22:43Z) - Iterative Algorithm Induced Deep-Unfolding Neural Networks: Precoding
Design for Multiuser MIMO Systems [59.804810122136345]
本稿では,AIIDNN(ディープ・アンフォールディング・ニューラルネット)を一般化した,ディープ・アンフォールディングのためのフレームワークを提案する。
古典的重み付き最小二乗誤差(WMMSE)反復アルゴリズムの構造に基づく効率的なIAIDNNを提案する。
提案したIAIDNNは,計算複雑性を低減した反復WMMSEアルゴリズムの性能を効率よく向上することを示す。
論文 参考訳(メタデータ) (2020-06-15T02:57:57Z) - PolyDL: Polyhedral Optimizations for Creation of High Performance DL
primitives [55.79741270235602]
本稿では,Deep Learningプリミティブの高性能実装を自動的に生成するコンパイラアルゴリズムを提案する。
我々は多面体モデルを用いた新しいデータ再利用分析アルゴリズムを開発した。
また、このようなハイブリッドコンパイラとライブラリ使用の最小限のアプローチが、最先端のパフォーマンスをもたらすことを示す。
論文 参考訳(メタデータ) (2020-06-02T06:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。