論文の概要: Osiris: A Systolic Approach to Accelerating Fully Homomorphic Encryption
- arxiv url: http://arxiv.org/abs/2408.09593v1
- Date: Sun, 18 Aug 2024 20:58:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-20 18:03:47.240142
- Title: Osiris: A Systolic Approach to Accelerating Fully Homomorphic Encryption
- Title(参考訳): Osiris: 完全同型暗号化を高速化するための論理的アプローチ
- Authors: Austin Ebel, Brandon Reagen,
- Abstract要約: 本稿では, シストリックアーキテクチャを用いて, 完全同型暗号(FHE)をいかに高速化できるかを示す。
我々は手足インターリービングと呼ばれる新しいデータタイリング手法を提案する。
Osirisの評価は、すべての標準ベンチマークにおいて、従来の最先端アクセラレータよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 3.16990548935142
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we show how fully homomorphic encryption (FHE) can be accelerated using a systolic architecture. We begin by analyzing FHE algorithms and then develop systolic or systolic-esque units for each major kernel. Connecting units is challenging due to the different data access and computational patterns of the kernels. We overcome this by proposing a new data tiling technique that we name limb interleaving. Limb interleaving creates a common data input/output pattern across all kernels that allows the entire architecture, named Osiris, to operate in lockstep. Osiris is capable of processing key-switches, bootstrapping, and full neural network inferences with high utilization across a range of FHE parameters. To achieve high performance, we propose a new giant-step centric (GSC) dataflow that efficiently maps state-of-the-art FHE matrix-vector product algorithms onto Osiris by optimizing for reuse and parallelism. Our evaluation of Osiris shows it outperforms the prior state-of-the-art accelerator on all standard benchmarks.
- Abstract(参考訳): 本稿では, シストリックアーキテクチャを用いて, 完全同型暗号(FHE)の高速化について述べる。
まず、FHEアルゴリズムを解析し、各主要カーネルに対して、シストリックまたはシストリックなユニットを開発する。
カーネルの異なるデータアクセスと計算パターンのため、接続ユニットは困難である。
これを克服するために、手足インターリービングと呼ばれる新しいデータタイリング技術を提案する。
Limbインターリービングはすべてのカーネルに共通するデータ入力/出力パターンを生成し、Osirisと呼ばれるアーキテクチャ全体をロックステップで動作させる。
Osirisは、キースイッチ、ブートストラップ、フルニューラルネットワーク推論を、さまざまなFHEパラメータで高い利用率で処理することができる。
高い性能を達成するために,再利用と並列性に最適化することで,最先端のFHE行列ベクトル積アルゴリズムをOsirisに効率的にマッピングする,新しい巨大ステップ中心データフローを提案する。
Osirisの評価は、すべての標準ベンチマークにおいて、従来の最先端アクセラレータよりも優れていることを示す。
関連論文リスト
- Accelerating Machine Learning Primitives on Commodity Hardware [0.0]
本稿では,Deep Neural Networks (DNN) における一般行列乗算 (GEMM) に基づく畳み込みよりも効率的な代替手段として,スライディングウィンドウ畳み込み手法について広範な研究を行う。
この結果から,Sliding Window 計算カーネルは CPU 上でも専用ハードウェアアクセラレータ上でも GEMM ベースの畳み込みよりも優れていることが示唆された。
これにより、特別なハードウェアを必要とせずに、低消費電力および低メモリデバイスにAIが広く採用される可能性がある。
論文 参考訳(メタデータ) (2023-10-08T16:26:18Z) - INR-Arch: A Dataflow Architecture and Compiler for Arbitrary-Order
Gradient Computations in Implicit Neural Representation Processing [66.00729477511219]
計算グラフとして表される関数を考えると、従来のアーキテクチャはn階勾配を効率的に計算する上で困難に直面している。
InR-Archは,n階勾配の計算グラフをハードウェア最適化データフローアーキテクチャに変換するフレームワークである。
1.8-4.8x と 1.5-3.6x の高速化を CPU と GPU のベースラインと比較した結果を示す。
論文 参考訳(メタデータ) (2023-08-11T04:24:39Z) - Efficient Dataset Distillation Using Random Feature Approximation [109.07737733329019]
本稿では,ニューラルネットワークガウス過程(NNGP)カーネルのランダム特徴近似(RFA)を用いた新しいアルゴリズムを提案する。
我々のアルゴリズムは、KIP上で少なくとも100倍のスピードアップを提供し、1つのGPUで実行できる。
RFA蒸留 (RFAD) と呼ばれる本手法は, 大規模データセットの精度において, KIP や他のデータセット凝縮アルゴリズムと競合して動作する。
論文 参考訳(メタデータ) (2022-10-21T15:56:13Z) - PACE: A Parallelizable Computation Encoder for Directed Acyclic Graphs [30.294095901315746]
本稿では,ノードを同時に処理し,DAGを並列に符号化する並列化アテンションベース構造(PACE)を提案する。
PACEは、トレーニングと推論速度を大幅に向上した従来のDAGエンコーダよりも効率を向上するだけでなく、スムーズな遅延(DAGエンコーディング)空間を生成する。
論文 参考訳(メタデータ) (2022-03-19T11:56:51Z) - Are we ready for beyond-application high-volume data? The Reeds robot
perception benchmark dataset [3.781421673607643]
本稿ではロボット認識アルゴリズムの研究のためにReedsと呼ばれるデータセットを提案する。
このデータセットは、アプリケーション固有のソリューションをテストする環境を提供するのではなく、アルゴリズムに要求されるベンチマーク機会を提供することを目的としている。
論文 参考訳(メタデータ) (2021-09-16T23:21:42Z) - Kernel Identification Through Transformers [54.3795894579111]
カーネル選択はガウス過程(GP)モデルの性能決定において中心的な役割を果たす。
この研究は、高次元GP回帰モデルのためのカスタムカーネル関数を構築するという課題に対処する。
KITT: Kernel Identification through Transformersを提案する。
論文 参考訳(メタデータ) (2021-06-15T14:32:38Z) - FuSeConv: Fully Separable Convolutions for Fast Inference on Systolic
Arrays [2.8583189395674653]
本稿では,深度的に分離可能な畳み込みの代替としてFuSeConvを提案する。
FuSeConvは、空間次元と深さ次元に沿って分離可能な1次元の畳み込みを完全に分解する。
我々は、画像Netデータセットに匹敵する精度で、64x64サイズのシストリックアレイ上で、MobileNetのネットワークファミリで3x-7xの大幅な高速化を実現した。
論文 参考訳(メタデータ) (2021-05-27T20:19:39Z) - Random Features for the Neural Tangent Kernel [57.132634274795066]
完全接続型ReLUネットワークのニューラルタンジェントカーネル(NTK)の効率的な特徴マップ構築を提案する。
得られた特徴の次元は、理論と実践の両方で比較誤差境界を達成するために、他のベースライン特徴マップ構造よりもはるかに小さいことを示しています。
論文 参考訳(メタデータ) (2021-04-03T09:08:12Z) - Fully Convolutional Networks for Panoptic Segmentation [91.84686839549488]
そこで我々は,Panoptic FCNという概念的,シンプルで,強力で,効率的なパノプティックセグメンテーションフレームワークを提案する。
我々のアプローチは、統一された完全な畳み込みパイプラインにおいて、前景や背景を表現し、予測することを目的としています。
Panoptic FCNは、提案されたカーネルジェネレータで、各オブジェクトインスタンスまたは物カテゴリを特定のカーネル重みにエンコードする。
論文 参考訳(メタデータ) (2020-12-01T18:31:41Z) - Federated Doubly Stochastic Kernel Learning for Vertically Partitioned
Data [93.76907759950608]
本稿では,垂直分割データに対する2倍のカーネル学習アルゴリズムを提案する。
本稿では,FDSKLがカーネルを扱う場合,最先端のフェデレーション学習手法よりもはるかに高速であることを示す。
論文 参考訳(メタデータ) (2020-08-14T05:46:56Z) - Are Gabor Kernels Optimal for Iris Recognition? [4.658023970671232]
Gaborカーネルは虹彩認識のための支配的なフィルタとして広く受け入れられている。
我々は,オープンソースのアイリス認識ソフトウェアに容易に移植可能なデータ駆動カーネルを学習する。
論文 参考訳(メタデータ) (2020-02-20T17:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。