論文の概要: VIPIR: A Versatile GPU Framework for Integrating Private Information Retrieval Protocols
- arxiv url: http://arxiv.org/abs/2606.11536v1
- Date: Wed, 10 Jun 2026 00:40:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 14:52:09.028477
- Title: VIPIR: A Versatile GPU Framework for Integrating Private Information Retrieval Protocols
- Title(参考訳): VIPIR: プライベート情報検索プロトコルを統合するためのVersatile GPUフレームワーク
- Authors: Jongmin Kim, Hyesung Ji, Jean-Luc Watson, Charles Gouert, G. Edward Suh, Jung Ho Ahn,
- Abstract要約: VIPIRは、GPUアクセラレーションを備えたPIRプロトコルを共同設計する汎用GPUフレームワークである。
我々は、最先端のPIRプロトコルが相補的制約を持つ2つのカテゴリに分類されることを示す統一解析モデルを開発した。
両クラス間の制約を克服し,これらのカテゴリのテクニックを柔軟に組み合わせた2つのプロトコルを提案する。
- 参考スコア(独自算出の注目度): 13.257148302181086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While private information retrieval (PIR) enables private database services by fully concealing access patterns, it simultaneously requires high computational throughput, large memory capacity, and substantial memory bandwidth. We introduce VIPIR, a versatile GPU framework that co-designs PIR protocols with GPU acceleration. We develop a unified analytic model showing that state-of-the-art PIR protocols fall into two categories with complementary limitations, and propose two protocols that flexibly combine techniques across these categories, overcoming the limitations of both classes. These protocols incorporate a GPU-friendly data compression method called expansion-based ring packing (ExpPack), which offers a high degree of parallelism and minimal communication cost. VIPIR applies further optimizations to core operations, including number-theoretic transforms (NTTs) and various matrix-matrix multiplications (GEMMs). Notably, we develop a tensor-core-based execution method for database multiplication by interpreting it as a mixed-integer-type GEMM. We also design memory-efficient scheduling methods that minimize intermediate buffers and enable multi-GPU scaling under memory capacity constraints. Overall, VIPIR achieves orders-of-magnitude higher throughput than prior PIR systems while reducing communication and memory overheads, making large-scale PIR practical.
- Abstract(参考訳): プライベート情報検索(PIR)は、アクセスパターンを完全に隠蔽することで、プライベートデータベースサービスを可能にするが、同時に高い計算スループット、大きなメモリ容量、かなりのメモリ帯域幅を必要とする。
我々は、GPUアクセラレーションを備えたPIRプロトコルを共設計する汎用GPUフレームワークであるVIPIRを紹介する。
我々は、最先端のPIRプロトコルが相補的な制約を持つ2つのカテゴリに分類されることを示す統一解析モデルを開発し、これらのカテゴリのテクニックを柔軟に組み合わせ、両方のクラスの制限を克服する2つのプロトコルを提案する。
これらのプロトコルには拡張ベースのリングパッキング(ExpPack)と呼ばれるGPUフレンドリなデータ圧縮手法が組み込まれており、高い並列性と最小の通信コストを提供する。
VIPIRは、数理論変換(NTT)や様々な行列行列行列乗算(GEMM)など、コア演算にさらなる最適化を適用する。
特に,混合整数型GEMMとして解釈することで,テンソルコアを用いたデータベース乗算実行法を開発した。
また、中間バッファを最小化し、メモリ容量制約下でのマルチGPUスケーリングを可能にするメモリ効率のスケジューリング手法も設計する。
全体として、VIPIRは従来のPIRシステムよりも高いスループットを実現し、通信やメモリオーバーヘッドを低減し、大規模PIRを実用化している。
関連論文リスト
- GPIR: Enabling Practical Private Information Retrieval with GPUs [10.979759633611133]
GPIRは、カーネル、データレイアウト、実行スケジュールを再考するGPUアクセラレーションPIRシステムである。
本稿では、各プリミティブな操作を別々に実行する運用レベルカーネルと、プロトコルステージ内のすべての操作を単一のカーネルに融合させてオンチップデータの再利用を最大化する運用レベルカーネルを切り替える、段階対応ハイブリッド実行モデルを提案する。
論文 参考訳(メタデータ) (2026-04-06T14:04:14Z) - A dynamic memory assignment strategy for dilation-based ICP algorithm on embedded GPUs [7.447980598008699]
本稿では,高性能ポイントクラウド登録アルゴリズムVANICPのメモリ効率の最適化手法を提案する。
VANICPフレームワークの拡張版を構築し,97%以上のメモリ消費削減を実現した。
論文 参考訳(メタデータ) (2025-12-04T17:10:15Z) - Eliminating Multi-GPU Performance Taxes: A Systems Approach to Efficient Distributed LLMs [61.953548065938385]
分析フレームワークとして'3つの税'(バルク同期、カーネル間データローカリティ、カーネルローンチオーバーヘッド)を紹介した。
我々は、分散GPU実行におけるキー非効率に対処するために、厳密なBSPモデルを超えて移動することを提案する。
BSPベースのアプローチによるエンドツーエンドのレイテンシの10-20%の高速化を観察する。
論文 参考訳(メタデータ) (2025-11-04T01:15:44Z) - Re-Densification Meets Cross-Scale Propagation: Real-Time Neural Compression of LiDAR Point Clouds [83.39320394656855]
LiDARポイントクラウドは、様々なアプリケーションに基本的だが、高精度スキャンは、かなりのストレージと送信オーバーヘッドを発生させる。
既存の手法では、非順序の点を階層的なオクツリーやボクセル構造に変換して、密度から疎い予測符号化を行うのが一般的である。
筆者らのフレームワークは2つの軽量モジュールから構成されている。まず、Geometry Re-Densification Moduleがエンコードされたスパース幾何を再認識し、より密なスケールで特徴を抽出し、予測符号化のための特徴を再分離する。
論文 参考訳(メタデータ) (2025-08-28T06:36:10Z) - AIRES: Accelerating Out-of-Core GCNs via Algorithm-System Co-Design [6.554916179445241]
グラフ畳み込みネットワーク(GCN)は、バイオメディカルタンパク質とタンパク質の相互作用(PPI)から大規模レコメンデーションシステムまで、様々な科学的応用において基本的なものである。
GCNのグラフ構造をモデル化するための重要な要素はスパース一般行列行列乗法(SpGEMM)である。
SpGEMMは、リソースに制約のあるシステムにおいて、限られたGPUメモリスペースのために、アウトオブコアで実行されることが多い。
本稿では,GCNのアウトオブコア SpGEMM 計算を高速化するアルゴリズム-システム共設計ソリューション AIRES を提案する。
論文 参考訳(メタデータ) (2025-07-02T00:35:43Z) - A Universal Framework for Compressing Embeddings in CTR Prediction [68.27582084015044]
本稿では,事前学習した埋め込みを定量化することにより,埋め込みテーブルを圧縮するモデル非依存型埋め込み圧縮(MEC)フレームワークを提案する。
まず、高頻度特徴と低周波特徴のバランスをとるために、人気重み付け正規化を適用します。
3つのデータセットの実験により,提案手法はメモリ使用量を50倍以上削減し,レコメンデーション性能を維持・改善する。
論文 参考訳(メタデータ) (2025-02-21T10:12:34Z) - COMPASS: A Compiler Framework for Resource-Constrained Crossbar-Array Based In-Memory Deep Learning Accelerators [6.172271429579593]
本稿では、資源制約付きクロスバーベース処理インメモリ(PIM)ディープニューラルネットワーク(DNN)アクセラレーターのためのコンパイラフレームワークを提案する。
本稿では,各パーティションをチップ上で高速化するために,各レイヤを分割する最適なパーティショニングを決定するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-01-12T11:31:25Z) - UniPT: Universal Parallel Tuning for Transfer Learning with Efficient
Parameter and Memory [69.33445217944029]
PETLは、トレーニング済みモデルを下流ドメインに適応するための効果的な戦略である。
最近のPETLは、より価値の高いメモリ効率特性に焦点を当てている。
メモリ効率の良い新しいPETL戦略Universal Parallel Tuning (UniPT)を提案する。
論文 参考訳(メタデータ) (2023-08-28T05:38:43Z) - A Vertex Cut based Framework for Load Balancing and Parallelism
Optimization in Multi-core Systems [15.913119724815733]
機械学習のような高レベルのアプリケーションは、単純な画像認識のための多層パーセプトロンに基づく単純なモデルから、自動運転車制御システムのためのより深くより複雑なニューラルネットワークへと進化している。
高性能コンピュータ上で動作する並列プログラムは、データ通信のボトルネック、メモリ帯域幅の制限、不規則なクリティカルセクションによる同期オーバーヘッドに悩まされることが多い。
マルチコアシステムにおけるデータ通信の削減と,これらのアプリケーションのスケーラビリティと性能向上のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-09T07:54:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。