論文の概要: DRAMatic Speedup: Accelerating HE Operations on a Processing-in-Memory System
- arxiv url: http://arxiv.org/abs/2602.12433v1
- Date: Thu, 12 Feb 2026 21:45:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:53.766655
- Title: DRAMatic Speedup: Accelerating HE Operations on a Processing-in-Memory System
- Title(参考訳): DRAMatic Speedup: 処理インメモリシステム上でのHE操作の高速化
- Authors: Niklas Klinger, Jonas Sander, Peterson Yuhala, Pascal Felber, Thomas Eisenbarth,
- Abstract要約: ホモモルフィック暗号化(HE)は、機密クラウドコンピューティングのための有望な技術である。
プロセッサ・イン・メモリ(Processing-in-Memory、PIM)は、プロセッサユニットとメモリを同じチップまたはメモリモジュールに統合する代替のハードウェアアーキテクチャである。
UPMEMのプログラム可能な汎用PIMシステム上で,HEの基本となる操作を実装したDRAMaticを提案する。
- 参考スコア(独自算出の注目度): 4.464102544889846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Homomorphic encryption (HE) is a promising technology for confidential cloud computing, as it allows computations on encrypted data. However, HE is computationally expensive and often memory-bound on conventional computer architectures. Processing-in-Memory (PIM) is an alternative hardware architecture that integrates processing units and memory on the same chip or memory module. PIM enables higher memory bandwidth than conventional architectures and could thus be suitable for accelerating HE. In this work, we present DRAMatic, which implements operations foundational to HE on UPMEM's programmable, general-purpose PIM system, and evaluate its performance. DRAMatic incorporates many arithmetic optimizations, including residue number system and number-theoretic transform techniques, and can support the large parameters required for secure homomorphic evaluations. To compare performance, we evaluate DRAMatic against Microsoft SEAL, a popular open-source HE library, regarding both runtime and energy efficiency. The results show that DRAMatic significantly closes the gap between UPMEM PIM and Microsoft SEAL. However, we also show that DRAMatic is currently constrained by UPMEM PIM's multiplication performance and data transfer overhead. Finally, we discuss potential hardware extensions to UPMEM PIM.
- Abstract(参考訳): ホモモルフィック暗号化(HE)は、暗号化されたデータの計算を可能にするため、機密クラウドコンピューティングのための有望な技術である。
しかし、HEは計算コストが高く、しばしば従来のコンピュータアーキテクチャでメモリバインドされる。
プロセッシング・イン・メモリ(Processing-in-Memory、PIM)は、プロセッサユニットとメモリを同じチップまたはメモリモジュールに統合する代替ハードウェアアーキテクチャである。
PIMは従来のアーキテクチャよりも高いメモリ帯域幅を実現するため、HEの高速化に適している。
本稿では,プログラム可能な汎用PIMシステム上でHEの基本となる操作を実装し,その性能評価を行うDRAMaticを提案する。
DRAMaticは、剰余数システムや数理論変換技術を含む多くの算術最適化を取り入れており、安全な同型評価に必要な大きなパラメータをサポートすることができる。
性能を比較するため、我々はDRAMaticを、オープンソースのHEライブラリであるMicrosoft SEALに対してランタイムとエネルギー効率の両方について評価した。
その結果,DRAMatic は UPMEM PIM と Microsoft SEAL のギャップを著しく埋めることがわかった。
しかし、DRAMaticは現在、UPMEM PIMの乗算性能とデータ転送オーバーヘッドに制約されていることも示している。
最後に, UPMEM PIMのハードウェア拡張の可能性について論じる。
関連論文リスト
- FAME: FPGA Acceleration of Secure Matrix Multiplication with Homomorphic Encryption [11.342625695057281]
ホモモルフィック暗号化(HE)は、クラウドコンピューティングにおけるプライバシー問題に対処する暗号化データに対するセキュアな計算を可能にする。
したがって、プライバシー保護機械学習のようなアプリケーションには、同型暗号化MM(HE MM)の高速化が不可欠である。
本稿では HE MM の帯域幅効率 FPGA 実装について述べる。
FAMEは、HE MM用に特別に設計されたFPGAベースのアクセラレーターである。
論文 参考訳(メタデータ) (2025-12-17T15:09:36Z) - Sangam: Chiplet-Based DRAM-PIM Accelerator with CXL Integration for LLM Inferencing [2.9665163298601342]
推論、特にデコードフェーズは、メモリバウンドGEMVまたはフラットGEMM操作によって支配される。
既存のインメモリソリューションは、メモリ容量の削減などの限界に直面している。
この作業は、これらの制限に対処するチップレットベースのメモリモジュールを提供する。
論文 参考訳(メタデータ) (2025-11-15T16:39:51Z) - Decoder-Hybrid-Decoder Architecture for Efficient Reasoning with Long Generation [108.0657508755532]
我々は、レイヤ間の効率的なメモリ共有のためのシンプルで効果的なメカニズムであるGated Memory Unit(GMU)を紹介した。
これは、GMUを組み込んでSambaベースのセルフデコーダからメモリ読み出し状態を共有するデコーダ・ハイブリッド・デコーダアーキテクチャである。
論文 参考訳(メタデータ) (2025-07-09T07:27:00Z) - MEM1: Learning to Synergize Memory and Reasoning for Efficient Long-Horizon Agents [84.62985963113245]
我々は,長時間のマルチターンタスクに対して,エージェントが一定のメモリで動作可能な,エンドツーエンドの強化学習フレームワークMEM1を紹介する。
各ターンでMEM1は、メモリ統合と推論を共同でサポートするコンパクトな共有内部状態を更新する。
その結果,MEM1-7Bは16目的のマルチホップQAタスクにおいて,Qwen2.5-14B-Instructと比較してメモリ使用量を3.7倍削減し,3.5倍の性能向上を示す。
論文 参考訳(メタデータ) (2025-06-18T19:44:46Z) - EPS-MoE: Expert Pipeline Scheduler for Cost-Efficient MoE Inference [49.94169109038806]
本稿では,既存の並列処理方式を超越したMoE用パイプラインスケジューラであるEPS-MoEを紹介する。
その結果,既存の並列推論手法と比較して,プリフィルスループットは52.4%向上した。
論文 参考訳(メタデータ) (2024-10-16T05:17:49Z) - DAISM: Digital Approximate In-SRAM Multiplier-based Accelerator for DNN
Training and Inference [4.718504401468233]
PIMソリューションは、まだ成熟していない新しいメモリ技術か、パフォーマンス上のオーバーヘッドとスケーラビリティの問題のあるビットシリアル計算に依存している。
本稿では,従来のメモリを用いてビット並列計算を行い,複数のワードラインのアクティベーションを利用する,SRAM内デジタル乗算器を提案する。
次に、この乗算器を利用したアーキテクチャであるDAISMを導入し、SOTAと比較して最大2桁高い面積効率を実現し、競争エネルギー効率を向上する。
論文 参考訳(メタデータ) (2023-05-12T10:58:21Z) - PIM-DRAM:Accelerating Machine Learning Workloads using Processing in
Memory based on DRAM Technology [2.6168147530506958]
MLワークロードにおける行列ベクトル演算を高速化する処理インメモリ(PIM)プリミティブを提案する。
提案したアーキテクチャ,マッピング,データフローは,GPUよりも最大で23倍,6.5倍のメリットが得られることを示す。
論文 参考訳(メタデータ) (2021-05-08T16:39:24Z) - GradPIM: A Practical Processing-in-DRAM Architecture for Gradient
Descent [17.798991516056454]
本稿では,ディープニューラルネットワークトレーニングのパラメータ更新を高速化するメモリ内処理アーキテクチャGradPIMを提案する。
DDR4 SDRAMをバンクグループ並列性に拡張することで、ハードウェアコストと性能の観点から、PIMモジュールでの動作設計を効率化できる。
論文 参考訳(メタデータ) (2021-02-15T12:25:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。