論文の概要: GPU Acceleration of Learning With Errors KEMs Using OpenACC for Post-Quantum Cryptography
- arxiv url: http://arxiv.org/abs/2606.01211v1
- Date: Sun, 31 May 2026 13:01:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.384691
- Title: GPU Acceleration of Learning With Errors KEMs Using OpenACC for Post-Quantum Cryptography
- Title(参考訳): 量子後暗号におけるOpenACCを用いたエラーKEMによるGPU高速化
- Authors: Tiziana Liberati, Nitin Shukla, Matteo Barbieri, Gabriella Bettonte, Elisabetta Boella, Simone Rizzo, Daniele Gregori, Marco Pedicini,
- Abstract要約: LWE問題に基づく鍵カプセル化機構(KEM)
実装は、すべてのテスト済みGPUプラットフォームで大幅な加速を実現している。
結果は、LWEベースの暗号化ワークロードの計算要求に対するGPUアクセラレーションの有効性を強調した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Shor's algorithm proved that asymmetric cryptographic protocols based on the integer factorization and discrete logarithm problems are no longer safe in a world with large-scale quantum computers. As a result, Post-Quantum Cryptography (PQC) has been developed over the last few years, seeking cryptographic primitives resistant to quantum attacks. One of the main hard problems underlying PQC schemes is the Learning with Errors (LWE) problem, which is significantly more computationally intensive than its classical predecessors. In this work, we present a Key Encapsulation Mechanism (KEM) based on plain LWE and develop a GPU-oriented implementation using OpenACC. We evaluate the performance of our accelerated application in terms of both time-to-solution and energy-to-solution, considering bare-metal and containerized executions across multiple NVIDIA GPU models and generations. Our implementation achieves significant acceleration across all tested GPU platforms. In particular, on the NVIDIA Grace Hopper Superchip, it attains up to a $208\times$ speedup over a multithreaded CPU baseline and enables the execution of problem sizes that are impractical on CPU architectures due to memory and synchronization constraints. Energy consumption analysis also shows $\approx 2\times$ better efficiency when using the Superchip compared to systems equipped with x86-based CPUs and NVIDIA H100 GPUs. These results highlight the effectiveness of GPU acceleration for computationally demanding LWE-based cryptographic workloads.
- Abstract(参考訳): Shorのアルゴリズムは、整数分解と離散対数問題に基づく非対称暗号プロトコルが、大規模量子コンピュータの世界ではもはや安全でないことを証明した。
その結果、ポスト量子暗号(PQC)はここ数年で開発され、量子攻撃に耐性のある暗号プリミティブが求められている。
PQCスキームの根底にある大きな問題の1つはLearning with Errors (LWE)問題である。
本稿では,通常のLWEに基づくキーカプセル化機構(KEM)を提案し,OpenACCを用いたGPU指向実装を開発する。
我々は、複数のNVIDIA GPUモデルおよび世代にわたるベアメタルおよびコンテナ化実行を考慮して、時間-解法とエネルギー-解法の両方の観点から、高速化されたアプリケーションの性能を評価する。
当社の実装は,テスト対象のGPUプラットフォームすべてに対して,大幅な高速化を実現しています。
特にNVIDIA Grace Hopper Superchipでは、マルチスレッドのCPUベースライン上で最大208\times$のスピードアップを実現し、メモリと同期の制約によってCPUアーキテクチャで非現実的な問題サイズの実行を可能にしている。
エネルギー消費分析では、x86ベースのCPUとNVIDIA H100 GPUを備えたシステムと比較すると、Superchipを使用する際の効率が$\approx 2\times$良くなっている。
これらの結果は、LWEベースの暗号化ワークロードの計算要求に対するGPUアクセラレーションの有効性を浮き彫りにした。
関連論文リスト
- GRAB-ANNS: High-Throughput Indexing and Hybrid Search via GPU-Native Bucketing [39.763467046232584]
動的ハイブリッド検索のためのGPUネイティブグラフインデックスであるGRAB-ANNSを提案する。
GRAB-ANNSは最新のCPUベースシステムよりも最大240.1倍高いクエリスループットと12.6倍高速なインデックス構築を実現する。
論文 参考訳(メタデータ) (2026-03-31T11:00:10Z) - Scaling Behaviors of Evolutionary Algorithms on GPUs: When Does Parallelism Pay Off? [43.96509049196842]
進化的アルゴリズム(EA)はグラフィックス処理ユニット(GPU)に実装され、並列処理能力を活用して効率を向上させる。
我々は,GPU並列処理が,単純な加速度測定以上のEAの挙動をどのように変化させるかを検討する。
その結果,GPUアクセラレーションの影響は多種多様であり,アルゴリズム構造に強く依存していることが判明した。
論文 参考訳(メタデータ) (2026-01-26T12:55:21Z) - A Scalable Multi-GPU Framework for Encrypted Large-Model Inference [5.966282323502589]
完全同型暗号化(FHE)を使用した暗号化AIは、強力なプライバシ保証を提供する。
最近の研究はFHEを加速するためにASICを提案しているが、計算を制約する高価な先進的な製造プロセスを必要としている。
本稿では,大規模モデル上でのFHE推論のためのマルチGPUフレームワークであるCeriumについて述べる。
論文 参考訳(メタデータ) (2025-12-12T04:15:38Z) - ZKProphet: Understanding Performance of Zero-Knowledge Proofs on GPUs [0.7544506709471767]
Zero-Knowledge Proofs (ZKP) は、暗号証明を構築し、秘密に関する情報を公開せずに、秘密入力の知識を計算で示すプロトコルである。
ZKPは、匿名化された暗号通貨やブロックチェーンスケーリングのような、プライベートで検証可能なコンピューティングにおける新しいアプリケーションを可能にする。
ZKPにおける実行ボトルネックのシステマティックなキャラクタリゼーションと、最新のGPUアーキテクチャにおけるスケーラビリティが欠落していることが、文献で明らかになっている。
論文 参考訳(メタデータ) (2025-09-17T22:52:19Z) - Q-GEAR: Improving quantum simulation framework [0.28402080392117757]
本稿では,Qiskit量子回路をCuda-Qカーネルに変換するソフトウェアフレームワークであるQ-Gearを紹介する。
Q-GearはCPUとGPUベースのシミュレーションをそれぞれ、最小のコーディング労力で2桁と10倍に高速化する。
論文 参考訳(メタデータ) (2025-04-04T22:17:51Z) - Ramp Up NTT in Record Time using GPU-Accelerated Algorithms and LLM-based Code Generation [11.120838175165986]
ホモモルフィック暗号化(HE)はプライバシ保護機械学習(PPML)のコアビルディングブロックである
HEの性能向上のために、多くのGPU加速暗号方式が提案されている。
大規模言語モデル(LLM)の強力なコード生成能力を考えると、実用的なGPUフレンドリなアルゴリズムコードを自動的に生成する可能性を探究する。
論文 参考訳(メタデータ) (2025-02-16T12:53:23Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - Faster than FAST: GPU-Accelerated Frontend for High-Speed VIO [46.20949184826173]
この研究は、既存のコンピュータビジョンアルゴリズムを改善するために、効率的な低レベルGPUハードウェア固有の命令の適用性に焦点を当てている。
特に、非マックス抑圧とその後の特徴選択は、全体的な画像処理遅延への顕著な寄与である。
論文 参考訳(メタデータ) (2020-03-30T14:16:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。