Fugu-MT 論文翻訳(概要): Code Generation for Cryptographic Kernels using Multi-word Modular Arithmetic on GPU

論文の概要: Code Generation for Cryptographic Kernels using Multi-word Modular Arithmetic on GPU

arxiv url: http://arxiv.org/abs/2501.07535v1
Date: Mon, 13 Jan 2025 18:15:44 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-14 19:20:14.354521
Title: Code Generation for Cryptographic Kernels using Multi-word Modular Arithmetic on GPU
Title（参考訳）: GPU上での多ワードモジュラ算術を用いた暗号カーネルのコード生成
Authors: Naifeng Zhang, Franz Franchetti,
Abstract要約: 同型暗号(FHE)とゼロ知識証明(ZKP)が分散環境におけるデータセキュリティのソリューションとして出現している。本稿では,Multi-word modular arithmetic (MoMA) の形式化を行い,大きなビット幅の整数演算を機械語上の演算に分解する。
参考スコア（独自算出の注目度）: 0.5831737970661138
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Fully homomorphic encryption (FHE) and zero-knowledge proofs (ZKPs) are emerging as solutions for data security in distributed environments. However, the widespread adoption of these encryption techniques is hindered by their significant computational overhead, primarily resulting from core cryptographic operations that involve large integer arithmetic. This paper presents a formalization of multi-word modular arithmetic (MoMA), which breaks down large bit-width integer arithmetic into operations on machine words. We further develop a rewrite system that implements MoMA through recursive rewriting of data types, designed for compatibility with compiler infrastructures and code generators. We evaluate MoMA by generating cryptographic kernels, including basic linear algebra subprogram (BLAS) operations and the number theoretic transform (NTT), targeting various GPUs. Our MoMA-based BLAS operations outperform state-of-the-art multi-precision libraries by orders of magnitude, and MoMA-based NTTs achieve near-ASIC performance on commodity GPUs.
Abstract（参考訳）: 分散環境におけるデータセキュリティのソリューションとして,完全同型暗号 (FHE) とゼロ知識証明 (ZKP) が出現している。しかし、これらの暗号化技術が広く採用されることは、大きな整数演算を含むコア暗号演算によって、その計算オーバーヘッドの大きな障害となる。本稿では,Multi-word modular arithmetic (MoMA) の形式化を行い,大きなビット幅の整数演算を機械語上の演算に分解する。さらに,コンパイラやコードジェネレータとの互換性のために設計されたデータ型の再帰的書き換えにより,MoMAを実装した書き換えシステムを開発した。我々は,基本線形代数サブプログラム (BLAS) 演算や数理論変換 (NTT) など,様々なGPUをターゲットにした暗号カーネルを生成することで,MoMAを評価する。我々のMoMAベースのBLAS操作は、最先端のマルチ精度ライブラリを桁違いに上回り、MoMAベースのNTTはコモディティGPU上でほぼASICのパフォーマンスを達成する。

関連論文リスト

Block encoding of sparse matrices with a periodic diagonal structure [67.45502291821956]
周期的な対角構造を持つスパース行列を符号化するための明示的な量子回路を提供する。本手法の様々な応用は, 微分問題を解く文脈で論じる。
論文参考訳（メタデータ） (2026-02-11T07:24:33Z)
Leveraging FPGAs for Homomorphic Matrix-Vector Multiplication in Oblivious Message Retrieval [2.8190885435355857]
メタデータを保護するための最も有効なアプローチは、送信側が公開掲示板にメッセージを投稿し、受信側が関連するメッセージをスキャンすることです。 OMR(Oblivious Message Search)は、同型暗号化(HE)を活用して、リソース豊富なサーバにスキャンを委譲することで、このソリューションのユーザエクスペリエンスを向上させる。本稿では,行列ベクトル乗算アルゴリズムを高速化するハードウェアアーキテクチャを提案する。
論文参考訳（メタデータ） (2025-12-12T16:12:02Z)
NGPU-LM: GPU-Accelerated N-Gram Language Model for Context-Biasing in Greedy ASR Decoding [54.88765757043535]
この研究は、統計的なn-gram言語モデルのデータ構造を再考し、GPU最適化推論の高速かつ並列な操作を可能にする。我々のアプローチは NGPU-LM と呼ばれ、7% 未満の計算オーバーヘッドを持つ全ての主要な ASR モデルに対して、カスタマイズ可能なgreedy decoding を導入している。提案手法は,ビーム探索による顕著な遅延を回避しつつ,greedy と beam search の精度ギャップの50%以上を排除できる。
論文参考訳（メタデータ） (2025-05-28T20:43:10Z)
TFHE-Coder: Evaluating LLM-agentic Fully Homomorphic Encryption Code Generation [10.597643264309415]
TFHE (Homomorphic Encryption over the Torus) は、復号化せずにデータを暗号化する。マシンラーニングのプライバシ保護、セキュアなマルチパーティ計算、プライベートブロックチェーントランザクション、セキュアな医療診断といった可能性にもかかわらず、暗号化の複雑さとユーザビリティの問題により、その採用は制限されている。この研究は、TFHEコード生成の最初のベンチマークを確立し、ドメイン固有のフィードバックで拡張されたLLMが、FHEコード生成の専門的ギャップを埋める方法を示している。
論文参考訳（メタデータ） (2025-03-15T17:57:44Z)
gECC: A GPU-based high-throughput framework for Elliptic Curve Cryptography [15.39096542261856]
Elliptic Curve Cryptography (ECC)は、Rivest-Shamir-Adleman (RSA)のような従来の技術に匹敵するセキュリティを提供する暗号化手法である。 ECCは、楕円曲線(EC)操作に関連する大きな性能上のオーバーヘッドによって、いまだに妨げられている。本稿では,GPUアーキテクチャ向けに最適化されたECCのための汎用フレームワークであるgECCを提案する。
論文参考訳（メタデータ） (2024-12-22T01:50:50Z)
Searching for Efficient Linear Layers over a Continuous Space of Structured Matrices [88.33936714942996]
アインシュタイン和を通じて表現可能なすべての線形作用素の探索を可能にする統一フレームワークを提案する。計算-最適スケーリング法則の違いは主に少数の変数によって支配されていることを示す。そこで,Mixture-of-Experts (MoE) は,注目ブロックの投影を含む,モデルのすべての線形層におけるMoEを学習する。
論文参考訳（メタデータ） (2024-10-03T00:44:50Z)
A Method for Efficient Heterogeneous Parallel Compilation: A Cryptography Case Study [8.06660833012594]
本稿では,多様なハードウェアアーキテクチャにまたがるデータ管理と並列計算を最適化するために,ハイパーという新しいMLIRベースの方言を提案する。 HETOCompilerは,複数のハッシュアルゴリズムを実装し,不均一なシステム上での実行を可能にする,暗号に着目したコンパイラのプロトタイプである。
論文参考訳（メタデータ） (2024-07-12T15:12:51Z)
BoostCom: Towards Efficient Universal Fully Homomorphic Encryption by Boosting the Word-wise Comparisons [14.399750086329345]
完全同型暗号化(FHE)は、最初に復号化することなく、暗号化データ上での計算の実行を可能にする。本稿では,単語比較処理の高速化を目的としたBoostComを提案する。我々は、最先端のCPUベースのuFHEシステムと比較して、桁違い(11.1倍高速)のエンドツーエンド性能向上を実現している。
論文参考訳（メタデータ） (2024-07-10T02:09:10Z)
On efficient normal bases over binary fields [0.0]
バイナリフィールド拡張は、暗号、コードベースの暗号、エラー訂正コードの基本である。本稿では,異なる範囲における演算の効率的な実装を示すために,$mathbbF_2n$ over $mathbbF$を探索する。
論文参考訳（メタデータ） (2024-02-18T11:06:20Z)
CodeChain: Towards Modular Code Generation Through Chain of Self-revisions with Representative Sub-modules [51.82044734879657]
我々は,自己修正の連鎖を通じてモジュール化されたコード生成を誘発する,新しい推論フレームワークであるCodeChainを提案する。 CodeChainは、生成したソリューションのモジュール性と正確性の両方を大幅に向上させ、APPSで35%、CodeContestsで76%の相対パス@1の改善を実現しています。
論文参考訳（メタデータ） (2023-10-13T10:17:48Z)
Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。 1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文参考訳（メタデータ） (2023-04-25T05:04:44Z)
High-performance symbolic-numerics via multiple dispatch [52.77024349608834]
Symbolics.jlは拡張可能なシンボルシステムで、動的多重ディスパッチを使用してドメインのニーズに応じて振る舞いを変更する。実装に依存しないアクションでジェネリックapiを形式化することで、システムに最適化されたデータ構造を遡及的に追加できることを示します。従来の用語書き換えシンプリファイアと電子グラフベースの用語書き換えシンプリファイアをスワップする機能を実証する。
論文参考訳（メタデータ） (2021-05-09T14:22:43Z)
Iterative Algorithm Induced Deep-Unfolding Neural Networks: Precoding Design for Multiuser MIMO Systems [59.804810122136345]
本稿では,AIIDNN(ディープ・アンフォールディング・ニューラルネット)を一般化した,ディープ・アンフォールディングのためのフレームワークを提案する。古典的重み付き最小二乗誤差(WMMSE)反復アルゴリズムの構造に基づく効率的なIAIDNNを提案する。提案したIAIDNNは,計算複雑性を低減した反復WMMSEアルゴリズムの性能を効率よく向上することを示す。
論文参考訳（メタデータ） (2020-06-15T02:57:57Z)
PolyDL: Polyhedral Optimizations for Creation of High Performance DL primitives [55.79741270235602]
本稿では,Deep Learningプリミティブの高性能実装を自動的に生成するコンパイラアルゴリズムを提案する。我々は多面体モデルを用いた新しいデータ再利用分析アルゴリズムを開発した。また、このようなハイブリッドコンパイラとライブラリ使用の最小限のアプローチが、最先端のパフォーマンスをもたらすことを示す。
論文参考訳（メタデータ） (2020-06-02T06:44:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。