論文の概要: HE-PIM: Demystifying Homomorphic Operations on a Real-world Processing-in-Memory System
- arxiv url: http://arxiv.org/abs/2605.12841v1
- Date: Wed, 13 May 2026 00:36:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.737665
- Title: HE-PIM: Demystifying Homomorphic Operations on a Real-world Processing-in-Memory System
- Title(参考訳): HE-PIM:実世界の処理-イン-メモリシステムにおける均質化操作
- Authors: Harshita Gupta, Mayank Kabra, Jaewoo Park, Priyam Mehta, Phillip Widdowson, Tathagata Barik, Nisa Bostancı, Konstantinos Kanellopoulos, Juan Gómez-Luna, Antonio J. Peña, Mohammad Sadrosadati, Onur Mutlu,
- Abstract要約: ホモモルフィック暗号化(HE)は、暗号化されたデータに対する計算を可能にし、信頼できない計算環境に対して強力なプライバシ保証を提供する。
実際の採用は、高い計算複雑性、大きな暗号文サイズ、実質的なデータ移動によって制限されている。
Processing-In-Memory (PIM) は、メモリの周辺または内部での計算による有望な緩和である。
- 参考スコア(独自算出の注目度): 12.932284199913944
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Homomorphic encryption (HE) enables computation over encrypted data, offering strong privacy guarantees for untrusted computing environments. Practical adoption remains limited by high computational complexity, large ciphertext sizes, and substantial data movement. Processor-centric architectures (CPUs, GPUs, ASICs) hit fundamental bottlenecks on HE workloads because ciphertexts are large, data locality is low, and primitives such as relinearization and bootstrapping repeatedly access large auxiliary metadata. Processing-In-Memory (PIM) is a promising mitigation by computing near or inside memory. Prior PIM proposals for HE either do not target real-world PIM systems or cover only a narrow set of operations. We comprehensively characterize HE operations on a real-world, general-purpose PIM system. We implement a complete set of HE kernels used by emerging applications (databases, machine learning) on the UPMEM PIM system, evaluate performance and scalability, compare against CPU and GPU baselines, and discuss implications for future PIM hardware. Our results demonstrate four major findings. (1) HE-based applications expose distinct bottlenecks across execution stages: some kernels are compute-bound due to modular arithmetic, while others are memory-bound due to large ciphertexts and intermediate data. These bottlenecks are exacerbated by limited per-core compute and per-bank capacity, which force frequent data movement. (2) The dominant compute bottleneck is the lack of native 64-bit modular integer multiplication, a key HE primitive. (3) Limited per-bank memory capacity is the second major bottleneck, since HE ciphertexts and auxiliary metadata do not fit and require inter-bank movement. (4) Despite these limits, PIM can be a viable alternative to state-of-the-art CPU and GPU systems for HE when equipped with native modular multiplication and efficient inter-PIM data movement.
- Abstract(参考訳): ホモモルフィック暗号化(HE)は、暗号化されたデータに対する計算を可能にし、信頼できない計算環境に対して強力なプライバシ保証を提供する。
実際の採用は、高い計算複雑性、大きな暗号文サイズ、実質的なデータ移動によって制限されている。
プロセッサ中心アーキテクチャ(CPU、GPU、ASIC)は、暗号文が大きく、データのローカリティが低く、リライナライゼーションやブートストラップといったプリミティブが大きな補助メタデータに繰り返しアクセスするため、HEワークロードの基本的なボトルネックにぶつかっている。
Processing-In-Memory (PIM) は、メモリの周辺または内部での計算による有望な緩和である。
HEの以前のPIM提案は、現実世界のPIMシステムをターゲットにしていないか、限られた操作のみをカバーしている。
実世界の汎用PIMシステム上でのHE操作を包括的に特徴付ける。
UPMEM PIMシステム上で、新興アプリケーション(データベース、機械学習)が使用するHEカーネルの完全なセットを実装し、性能とスケーラビリティを評価し、CPUとGPUベースラインを比較し、将来のPIMハードウェアへの影響について議論する。
以上の結果から,4つの大きな発見が得られた。
1) HEベースのアプリケーションは,モジュール演算による計算バウンドのカーネルや,大きな暗号文や中間データによるメモリバウンドのカーネルなど,実行段階で異なるボトルネックを顕在化している。
これらのボトルネックは、コア単位の計算能力とバンク単位のキャパシティによって悪化し、頻繁なデータ移動を強いる。
(2) 計算のボトルネックは、ネイティブな64ビットモジュラー整数乗算が欠如していることである。
3) HE暗号文と補助メタデータはバンク間移動を必要としないため,バンク単位のメモリ容量の制限が第2のボトルネックとなる。
(4) これらの制限にもかかわらず、PIMは、ネイティブなモジュラ乗算と効率的なPIM間データ移動を備えた場合、HEのための最先端のCPUおよびGPUシステムの代替となる可能性がある。
関連論文リスト
- Understand and Accelerate Memory Processing Pipeline for Disaggregated LLM Inference [45.78442013449325]
大規模言語モデルは、複雑な推論をサポートするための効率的な長文処理と生成機構に依存している。
これらの最適化は、Prepare Memory、Compute Relevancy、Retrieval、Apply to Inferenceという4段階のメモリ処理パイプラインに統合できることを示す。
この知見に触発されて、textbheterogeneous システムはメモリ処理の高速化やエンドツーエンドの推論に適していると論じる。
論文 参考訳(メタデータ) (2026-03-30T21:03:39Z) - DRAMatic Speedup: Accelerating HE Operations on a Processing-in-Memory System [4.464102544889846]
ホモモルフィック暗号化(HE)は、機密クラウドコンピューティングのための有望な技術である。
プロセッサ・イン・メモリ(Processing-in-Memory、PIM)は、プロセッサユニットとメモリを同じチップまたはメモリモジュールに統合する代替のハードウェアアーキテクチャである。
UPMEMのプログラム可能な汎用PIMシステム上で,HEの基本となる操作を実装したDRAMaticを提案する。
論文 参考訳(メタデータ) (2026-02-12T21:45:15Z) - Space Filling Curves is All You Need: Communication-Avoiding Matrix Multiplication Made Simple [42.09057806159106]
一般行列乗算はディープラーニングとHPCワークロードの基盤である。
行列乗算アクセラレータを持つ現代のプラットフォームは高いFLOP/Byteマシンバランスを示す。
この作業では、この面倒なチューニングの問題を緩和するために、空間充填曲線 (SFC) を再検討する。
我々は,データ局所性を本質的に高次に示す,プラットフォーム指向および形状指向の行列乗算スキームを得る。
論文 参考訳(メタデータ) (2026-01-22T19:56:16Z) - Intra-DP: A High Performance Collaborative Inference System for Mobile Edge Computing [67.98609858326951]
Intra-DPはモバイルデバイス上でのディープニューラルネットワーク(DNN)に最適化された高性能な協調推論システムである。
推論毎のレイテンシを最大50%削減し、最先端のベースラインと比較してエネルギー消費量を最大75%削減する。
評価の結果,DP内の遅延は,最先端のベースラインと比較して最大50%,エネルギー消費は最大75%減少することがわかった。
論文 参考訳(メタデータ) (2025-07-08T09:50:57Z) - BiVM: Accurate Binarized Neural Network for Efficient Video Matting [56.000594826508504]
リアルタイムビデオマッチングのためのディープニューラルネットワークは、エッジデバイスに重大な計算制限を被る。
ビデオマッティングのための正確でリソース効率のよいバイナリニューラルネットワークであるBiVMを提案する。
BiVMは、最先端(SOTA)バイナライゼーション手法を含む、代替のバイナライズされたビデオマッティングネットワークをかなり上回っている。
論文 参考訳(メタデータ) (2025-07-06T16:32:37Z) - Evaluating the Potential of In-Memory Processing to Accelerate Homomorphic Encryption [1.5707609236065612]
ホモモルフィック暗号化(HE)は、復号化を必要とせずに計算を可能にする。
基礎となる暗号操作に関連する高い計算とメモリオーバーヘッドは、HEベースのソリューションの実用性を妨げている。
処理インメモリ(PIM)は、計算をデータに近づけることで、プロセッサメモリのデータ移動によるオーバーヘッドを低減することにより、この問題に対して有望な解決策を提供する。
論文 参考訳(メタデータ) (2024-12-12T10:28:58Z) - PhD Forum: Efficient Privacy-Preserving Processing via Memory-Centric Computing [0.0]
ホモモルフィック暗号化(HE)とセキュアマルチパーティ計算(SMPC)は、暗号化されたデータの処理を可能にすることにより、データのセキュリティを高める。
既存のアプローチでは、特別なハードウェアを使用して計算オーバーヘッドを改善することに重点を置いている。
我々は、最近利用可能なPIMハードウェアを用いて、効率的なプライバシ保存計算を実現するフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-25T09:37:50Z) - PIM-Opt: Demystifying Distributed Optimization Algorithms on a Real-World Processing-In-Memory System [21.09681871279162]
大規模データセットに対するモダン機械学習(ML)トレーニングは、時間を要する作業量である。
最適化アルゴリズムであるGradient Descent (SGD) は、その効率性、単純さ、一般化性能に頼っている。
プロセッサ中心のアーキテクチャは、MLトレーニングワークロードの実行中に低パフォーマンスと高エネルギー消費に悩まされる。
Processing-In-Memory(PIM)は、データ移動のボトルネックを軽減するための有望なソリューションである。
論文 参考訳(メタデータ) (2024-04-10T17:00:04Z) - FusionAI: Decentralized Training and Deploying LLMs with Massive
Consumer-Level GPUs [57.12856172329322]
我々は、巨大な未使用のコンシューマレベルのGPUをアンロックする分散システムを構想する。
このシステムは、CPUとGPUメモリの制限、ネットワーク帯域幅の低さ、ピアとデバイスの多様性など、重要な課題に直面している。
論文 参考訳(メタデータ) (2023-09-03T13:27:56Z) - Faster Secure Data Mining via Distributed Homomorphic Encryption [108.77460689459247]
ホモモルフィック暗号化(HE)は、最近、暗号化されたフィールド上で計算を行う能力により、ますます注目を集めている。
本稿では,スケーリング問題の解決に向けて,新しい分散HEベースのデータマイニングフレームワークを提案する。
各種データマイニングアルゴリズムとベンチマークデータセットを用いて,新しいフレームワークの有効性と有効性を検証する。
論文 参考訳(メタデータ) (2020-06-17T18:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。