Fugu-MT 論文翻訳(概要): A Constant-Time Hardware Architecture for the CSIDH Key-Exchange Protocol

論文の概要: A Constant-Time Hardware Architecture for the CSIDH Key-Exchange Protocol

arxiv url: http://arxiv.org/abs/2508.11082v1
Date: Thu, 14 Aug 2025 21:37:29 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-18 14:51:23.678154
Title: A Constant-Time Hardware Architecture for the CSIDH Key-Exchange Protocol
Title（参考訳）: CSIDH鍵交換プロトコルのための定時間ハードウェアアーキテクチャ
Authors: Sina Bagheri, Masoud Kaveh, Francisco Hernando-Gallego, Diego Martín, Nuria Serrano,
Abstract要約: 本稿では,FPGAおよびASICプラットフォーム上でのCSIDHの包括的ハードウェア研究について述べる。 CSIDH-512の定時設計では、鍵発生1回あたりのクロックサイクルは1.03時間108ドルである。 180nmプロセスでのASIC実装では、設計には1.065times108$クロックサイクルが必要であり、アシトールデ180MHzの周波数を実現し、キー生成遅延は591msである。
参考スコア（独自算出の注目度）: 0.6597195879147555
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The commutative supersingular isogeny Diffie-Hellman (CSIDH) algorithm is a promising post-quantum key exchange protocol, notable for its exceptionally small key sizes, but hindered by computationally intensive key generation. Furthermore, practical implementations must operate in constant time to mitigate side-channel vulnerabilities, which presents an additional performance challenge. This paper presents, to our knowledge, the first comprehensive hardware study of CSIDH, establishing a performance baseline with a unified architecture on both field-programmable gate array (FPGA) and application-specific integrated circuit (ASIC) platforms. The architecture features a top-level finite state machine (FSM) that orchestrates a deeply pipelined arithmetic logic unit (ALU) to accelerate the underlying 512-bit finite field operations. The ALU employs a parallelized schoolbook multiplier, completing a 512$\times$512-bit multiplication in 22 clock cycles and enabling a full Montgomery modular multiplication in 87 cycles. The constant-time CSIDH-512 design requires $1.03\times10^{8}$ clock cycles per key generation. When implemented on a Xilinx Zynq UltraScale+ FPGA, the architecture achieves a 200 MHz clock frequency, corresponding to a 515 ms latency. For ASIC implementation in a 180nm process, the design requires $1.065\times10^{8}$ clock cycles and achieves a \textasciitilde 180 MHz frequency, resulting in a key generation latency of 591 ms. By providing the first public hardware performance metrics for CSIDH on both FPGA and ASIC platforms, this work delivers a crucial benchmark for future isogeny-based post-quantum cryptography (PQC) accelerators.
Abstract（参考訳）: 可換な超特異なDiffie-Hellman(CSIDH)アルゴリズムは量子後鍵交換プロトコルであり、非常に小さな鍵サイズで有名だが、計算集約的な鍵生成によって妨げられている。さらに、実用的な実装は、サイドチャネルの脆弱性を軽減するために一定の時間で動作しなければなりません。本稿では,CSIDH のハードウェア研究として,FPGA とアプリケーション固有の集積回路 (ASIC) の両プラットフォームに統一アーキテクチャを組み込んだ性能ベースラインを確立することを目的とした。このアーキテクチャは、基礎となる512ビット有限場演算を高速化するために、深くパイプライン化された算術論理ユニット(ALU)を編成するトップレベル有限状態機械(FSM)を備えている。 ALUは並列化されたスクールブック乗算器を採用し、22クロックサイクルで512$\times$512-bit乗算を完了し、87サイクルで完全なモンゴメリーモジュラ乗算を可能にする。 CSIDH-512の定時設計では、鍵生成毎に1.03\times10^{8}$クロックサイクルを必要とする。 Xilinx Zynq UltraScale+ FPGAに実装すると、アーキテクチャは515msの遅延に対応する200MHzのクロック周波数を達成する。 180nmプロセスにおけるASICの実装には、1.065\times10^{8}$クロックサイクルが必要で、180MHzの周波数を実現し、キー生成遅延は591msとなる。FPGAとASICプラットフォームの両方でCSIDHのための最初のハードウェアパフォーマンス指標を提供することにより、この研究は将来の等質ベースのポスト量子暗号(PQC)アクセラレーターにとって重要なベンチマークを提供する。

関連論文リスト

A High Performance and Efficient Post-Quantum Crypto-Processor for FrodoKEM [24.961829196441887]
FrodoKEMは格子型後量子鍵カプセル化機構(KEM)である国際標準化機構(ISO)により標準化が検討されている。本稿では,FrodoKEMのための高性能かつ効率的な暗号プロセッサを提案する。
論文参考訳（メタデータ） (2026-01-23T07:05:42Z)
SCE-NTT: A Hardware Accelerator for Number Theoretic Transform Using Superconductor Electronics [12.616265554244313]
本研究では, 超伝導エレクトロニクス(SCE)を用いた完全同相暗号(FHE)の高速化について検討する。本稿では,超伝導単一フラックス量子(SFQ)論理とメモリに基づく専用ハードウェアアクセラレータであるSCE-NTTを紹介する。我々はNTT-128ユニットが34GHzで531万NTT/secを達成することを示す。
論文参考訳（メタデータ） (2025-08-28T23:37:51Z)
Optimization and Synthesis of Quantum Circuits with Global Gates [44.99833362998488]
我々は、イオントラップハードウェアに存在するGlobal Molmer-Sorensenゲートのようなグローバルな相互作用を用いて量子回路を最適化し、合成する。このアルゴリズムはZX計算に基づいており、係留ゲートをGlobal MolmerSorensenゲートにグループ化する特別な回路抽出ルーチンを使用する。我々は,このアルゴリズムを様々な回路でベンチマークし,最新ハードウェアによる性能向上の方法を示す。
論文参考訳（メタデータ） (2025-07-28T10:25:31Z)
Cost-Effective Optimization and Implementation of the CRT-Paillier Decryption Algorithm for Enhanced Performance [0.0]
本稿では,eCRT-Paillier復号アルゴリズムを提案する。これらの2つの改善により、CRT-Paillier復号アルゴリズムの後処理において、50%のモジュラ乗算と60%の判定操作が削減された。評価のために、Xilinx Virtex-7 FPGAにMESAという高スループットで効率的なPaillierアクセラレータを実装した。
論文参考訳（メタデータ） (2025-06-22T08:06:36Z)
Toward a Lightweight, Scalable, and Parallel Secure Encryption Engine [0.0]
SPiMEは軽量でスケーラブルでFPGA互換のSecure Processor-in-Memory Encryptionアーキテクチャである。 Advanced Encryption Standard (AES-128)を直接Processing-in-Memoryフレームワークに統合する。持続的な暗号化スループットを25Gbps以上提供し、予測可能な低レイテンシパフォーマンスを実現している。
論文参考訳（メタデータ） (2025-06-18T02:25:04Z)
Resource Analysis of Low-Overhead Transversal Architectures for Reconfigurable Atom Arrays [38.6948808036416]
本稿では,大規模フォールトトレラント量子アルゴリズムのレイアウトと資源推定をサポートする低オーバヘッドアーキテクチャを提案する。 2048ビットのRSAファクタリングは5.6日で19万キュービットで実行でき、QECサイクルは1ミリ秒である。
論文参考訳（メタデータ） (2025-05-21T18:00:18Z)
Low latency FPGA implementation of twisted Edward curve cryptography hardware accelerator over prime field [0.5420492913071214]
本稿では,フィールドプログラマブルゲートアレイ(FPGA)に基づくモジュール演算,グループ演算,点乗算ユニットのハードウェア実装について述べる。提案した点乗算モジュールは1.4ミリ秒の時間を消費し、最大クロック周波数は117.8MHzである。このアーキテクチャは、高速無線通信ネットワークにおける高速なデータ暗号化の候補となるだろう。
論文参考訳（メタデータ） (2025-04-30T06:03:36Z)
Design of an FPGA-Based Neutral Atom Rearrangement Accelerator for Quantum Computing [1.003635085077511]
ニュートラル原子は量子コンピュータを実装するための有望な技術として登場した。本稿では,分割・対数戦略を応用し,複数の原子の同時移動を可能にする新しい四分法に基づく再配置アルゴリズムを提案する。これは原子再構成のための最初のハードウェアアクセラレーションであり、処理時間を著しく短縮する。
論文参考訳（メタデータ） (2024-11-19T10:38:21Z)
Bifurcated Attention: Accelerating Massively Parallel Decoding with Shared Prefixes in LLMs [39.16152482491236]
Bifurcated attentionは、共有コンテキストバッチデコードシナリオにおける言語モデル推論を強化するために設計された手法である。提案手法は,高バッチサイズおよび拡張コンテキスト長のレイテンシに寄与する重要な要因である冗長メモリIOコストの課題に対処する。
論文参考訳（メタデータ） (2024-03-13T16:30:57Z)
A Heterogeneous RISC-V based SoC for Secure Nano-UAV Navigation [40.8381466360025]
ナノUAVは高度な計算能力を必要とする一方で、大きな電力とペイロードの制約に直面している。 9mm2200mWシステム・オン・ア・チップ(SoC)のShaheenについて紹介する。 Linux対応のRV64コアと、v1.0の承認されたハイパーバイザ拡張と、低コストで低消費電力のメモリコントローラを統合している。同時に、汎用DSP向けに最適化されたRV32コアの完全プログラム可能なエネルギー効率と面積効率のマルチコアクラスタを統合している。
論文参考訳（メタデータ） (2024-01-07T16:03:47Z)
FPGA-QHAR: Throughput-Optimized for Quantized Human Action Recognition on The Edge [0.6254873489691849]
本稿では,8ビット量子化された2ストリームSimpleNet-PyTorch CNNアーキテクチャに基づく,エンドツーエンドHAR拡張型HW/SWアクセラレータの共設計を提案する。私たちの開発では、部分的にストリーミングデータフローアーキテクチャを使用して、ネットワーク設計やリソース利用のトレードオフよりも高いスループットを実現しています。提案手法は,ZCU104上の187MHzで約24FPSのリアルタイム推論スループットを用いて,約81%の予測精度を達成した。
論文参考訳（メタデータ） (2023-11-04T10:38:21Z)
A High Performance Compiler for Very Large Scale Surface Code Computations [38.26470870650882]
大規模量子誤り訂正のための最初の高性能コンパイラを提案する。任意の量子回路を格子手術に基づく表面符号演算に変換する。コンパイラは、物理デバイスのリアルタイム操作に向けられた速度で、ストリーミングパイプラインを使用して数百万のゲートを処理することができる。
論文参考訳（メタデータ） (2023-02-05T19:06:49Z)
Universal qudit gate synthesis for transmons [44.22241766275732]
超伝導量子プロセッサを設計する。本稿では,2量子共振共振ゲートを備えたユニバーサルゲートセットを提案する。ノイズの多い量子ハードウェアのための$rm SU(16)$ゲートの合成を数値的に実証する。
論文参考訳（メタデータ） (2022-12-08T18:59:53Z)
LL-GNN: Low Latency Graph Neural Networks on FPGAs for High Energy Physics [45.666822327616046]
本研究は,粒子検出器のための低グラフニューラルネットワーク(LL-GNN)設計のための新しい再構成可能なアーキテクチャを提案する。 LL-GNNの設計は、洗練されたアルゴリズムが実験データを効率的に処理できるようにすることで、次世代のトリガーシステムを進化させる。
論文参考訳（メタデータ） (2022-09-28T12:55:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。