論文の概要: KiD: A Hardware Design Framework Targeting Unified NTT Multiplication for CRYSTALS-Kyber and CRYSTALS-Dilithium on FPGA
- arxiv url: http://arxiv.org/abs/2311.04581v1
- Date: Wed, 8 Nov 2023 10:26:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 13:26:22.807348
- Title: KiD: A Hardware Design Framework Targeting Unified NTT Multiplication for CRYSTALS-Kyber and CRYSTALS-Dilithium on FPGA
- Title(参考訳): KiD:FPGA上のCRYSTALS-KyberとCRYSTALS-Dilithiumの統一NTT乗算を目的としたハードウェア設計フレームワーク
- Authors: Suraj Mandal, Debapriya Basu Roy,
- Abstract要約: 大規模なスタンドアロン乗算は、CRYSTALS-KyberやDilithiumのような、量子後安全な格子ベースの暗号アルゴリズムの不可欠な構成要素である。
本稿では,CRYSTALS-KyberとDilithiumの両方の乗算をサポート可能な,統一的で共有されたNTTアーキテクチャの開発を目指している。
- 参考スコア(独自算出の注目度): 1.134327592583549
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-degree polynomial multiplication is an integral component of post-quantum secure lattice-based cryptographic algorithms like CRYSTALS-Kyber and Dilithium. The computational complexity of large-degree polynomial multiplication can be reduced significantly through Number Theoretic Transformation (NTT). In this paper, we aim to develop a unified and shared NTT architecture that can support polynomial multiplication for both CRYSTALS-Kyber and Dilithium. More specifically, in this paper, we have proposed three different unified architectures for NTT multiplication in CRYSTALS-Kyber and Dilithium with varying numbers of configurable radix-2 butterfly units. Additionally, the developed implementation is coupled with a conflict-free memory mapping scheme that allows the architecture to be fully pipelined. We have validated our implementation on Artix-7, Zynq-7000 and Zynq Ultrascale+ FPGAs. Our standalone implementations for NTT multiplication for CRYSTALS-Kyber and Dilithium perform better than the existing works, and our unified architecture shows excellent area and timing performance compared to both standalone and existing unified implementations. This architecture can potentially be used for compact and efficient implementation for CRYSTALS-Kyber and Dilithium.
- Abstract(参考訳): 大次多項式乗算は、CRYSTALS-KyberやDilithiumのような、量子後安全な格子ベースの暗号アルゴリズムの不可欠な構成要素である。
大次多項式乗算の計算複雑性は、数論変換(NTT)によって著しく減少することができる。
本稿では,CRYSTALS-KyberとDilithiumの両方の多項式乗算をサポート可能な,統一的で共有的なNTTアーキテクチャを開発することを目的とする。
具体的には,CRYSTALS-Kyber と Dilithium におけるNTT乗算のための3つの異なる統一アーキテクチャを提案する。
さらに、開発された実装は、アーキテクチャを完全にパイプライン化できるコンフリクトフリーなメモリマッピングスキームと結合されている。
我々はArtix-7、Zynq-7000、Zynq Ultrascale+FPGAの実装を検証した。
CRYSTALS-Kyber と Dilithium のNTT乗算のスタンドアロン実装は,既存の作業よりも優れた性能を示し,我々の統合アーキテクチャは,スタンドアロンおよび既存の統合実装と比較して,優れた面積とタイミング性能を示す。
このアーキテクチャは、CRYSTALS-KyberとDilithiumのコンパクトで効率的な実装に使用できる。
関連論文リスト
- AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation [48.82264764771652]
本稿では,畳み込みブロックと変圧器ブロックを組み合わせたハイブリッドアーキテクチャAsCANを紹介する。
AsCANは、認識、セグメンテーション、クラス条件画像生成など、さまざまなタスクをサポートしている。
次に、同じアーキテクチャをスケールして、大規模なテキスト・イメージタスクを解決し、最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-11-07T18:43:17Z) - Trinity: A General Purpose FHE Accelerator [17.213234642867537]
我々は、CKKS、TFHE、およびそれらの変換スキームを1つのアクセラレータ内で効率的にサポートする統一アーキテクチャに基づく、最初のマルチモーダルFHEアクセラレータを提案する。
本稿では,アルゴリズム最適化,ハードウェアコンポーネントの再利用,動的ワークロードスケジューリングを取り入れた新しいFHEアクセラレータTrinityを提案する。
論文 参考訳(メタデータ) (2024-10-17T10:02:38Z) - EPS-MoE: Expert Pipeline Scheduler for Cost-Efficient MoE Inference [49.94169109038806]
本稿では,新しいパイプラインスケジューラであるEPS-MoEを紹介する。
その結果,既存の並列推論手法に比べて,プリフィルスループットが平均21%向上していることが判明した。
論文 参考訳(メタデータ) (2024-10-16T05:17:49Z) - HF-NTT: Hazard-Free Dataflow Accelerator for Number Theoretic Transform [2.4578723416255754]
多項式乗法は、完全同型暗号(FHE)など、多くのアプリケーションにおける基本的な演算の1つである。
Numberoretic Transform (NTT) は、適応可能な乗算を向上するための有効なツールであるが、NTT加速器を高速に生成する方法が欠如している。
本稿では,新しいNTTアクセラレータであるHF-NTTを導入し,ビット反転操作を不要とするデータ移動戦略を提案する。
論文 参考訳(メタデータ) (2024-10-07T07:31:38Z) - PolyTOPS: Reconfigurable and Flexible Polyhedral Scheduler [1.6673953344957533]
本稿では,多面体スケジューラであるPolyTOPSを導入する。
PolyTOPSはIllとCLooGをコードジェネレータとして使用しており、MindSporeのディープラーニングコンパイラに統合されている。
論文 参考訳(メタデータ) (2024-01-12T16:11:27Z) - KyberMat: Efficient Accelerator for Matrix-Vector Polynomial Multiplication in CRYSTALS-Kyber Scheme via NTT and Polyphase Decomposition [20.592217626952507]
CRYSTAL-Kyber (Kyber) は、標準化プロセス中に選択された暗号鍵カプセル化機構 (KEM) の1つである。
本稿では,Kyberアーキテクチャのレイテンシとスループットの制約に対する最適化について述べる。
論文 参考訳(メタデータ) (2023-10-06T22:57:25Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - Squeezeformer: An Efficient Transformer for Automatic Speech Recognition [99.349598600887]
Conformerは、そのハイブリッドアテンション・コンボリューションアーキテクチャに基づいて、様々な下流音声タスクの事実上のバックボーンモデルである。
Squeezeformerモデルを提案する。これは、同じトレーニングスキームの下で、最先端のASRモデルよりも一貫して優れている。
論文 参考訳(メタデータ) (2022-06-02T06:06:29Z) - Reconfigurable co-processor architecture with limited numerical
precision to accelerate deep convolutional neural networks [0.38848561367220275]
畳み込みニューラルネットワーク(CNN)は、視覚システムやロボット工学などのディープラーニングアプリケーションで広く使われている。
本稿では,CNNを高速化するために,モデルに依存しない再構成可能なコプロセッシングアーキテクチャを提案する。
既存の解とは対照的に、算術表現や演算のための限定精度32bit Q-format固定点量子化を導入する。
論文 参考訳(メタデータ) (2021-08-21T09:50:54Z) - Towards Accurate and Compact Architectures via Neural Architecture
Transformer [95.4514639013144]
計算コストを増すことなくパフォーマンスを向上させるために、アーキテクチャ内の操作を最適化する必要がある。
我々は最適化問題をマルコフ決定プロセス(MDP)にキャストするニューラルアーキテクチャ変換器(NAT)法を提案している。
NAT++(Neural Architecture Transformer++)メソッドを提案し、アーキテクチャ最適化のパフォーマンスを改善するために、候補遷移のセットをさらに拡大する。
論文 参考訳(メタデータ) (2021-02-20T09:38:10Z) - PolyDL: Polyhedral Optimizations for Creation of High Performance DL
primitives [55.79741270235602]
本稿では,Deep Learningプリミティブの高性能実装を自動的に生成するコンパイラアルゴリズムを提案する。
我々は多面体モデルを用いた新しいデータ再利用分析アルゴリズムを開発した。
また、このようなハイブリッドコンパイラとライブラリ使用の最小限のアプローチが、最先端のパフォーマンスをもたらすことを示す。
論文 参考訳(メタデータ) (2020-06-02T06:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。