論文の概要: PP-STAT: An Efficient Privacy-Preserving Statistical Analysis Framework using Homomorphic Encryption
- arxiv url: http://arxiv.org/abs/2508.12093v1
- Date: Sat, 16 Aug 2025 16:24:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.563026
- Title: PP-STAT: An Efficient Privacy-Preserving Statistical Analysis Framework using Homomorphic Encryption
- Title(参考訳): PP-STAT: 同型暗号化を用いた効率的なプライバシー保護統計分析フレームワーク
- Authors: Hyunmin Choi,
- Abstract要約: PP-STATは、プライバシー保護統計分析のための同型暗号化ベースのフレームワークである。
PP-STATはZスコア正規化、歪度、曲率、変動係数、ピアソン相関係数などの高度な統計測度をサポートし、すべて暗号化データ上で安全に計算される。
実世界のデータセットを評価した結果,PP-STATは平均相対誤差(MRE)が2.4x10-4以下であることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the widespread adoption of cloud computing, the need for outsourcing statistical analysis to third-party platforms is growing rapidly. However, handling sensitive data such as medical records and financial information in cloud environments raises serious privacy concerns. In this paper, we present PP-STAT, a novel and efficient Homomorphic Encryption (HE)-based framework for privacy-preserving statistical analysis. HE enables computations to be performed directly on encrypted data without revealing the underlying plaintext. PP-STAT supports advanced statistical measures, including Z-score normalization, skewness, kurtosis, coefficient of variation, and Pearson correlation coefficient, all computed securely over encrypted data. To improve efficiency, PP-STAT introduces two key optimizations: (1) a Chebyshev-based approximation strategy for initializing inverse square root operations, and (2) a pre-normalization scaling technique that reduces multiplicative depth by folding constant scaling factors into mean and variance computations. These techniques significantly lower computational overhead and minimize the number of expensive bootstrapping procedures. Our evaluation on real-world datasets demonstrates that PP-STAT achieves high numerical accuracy, with mean relative error (MRE) below 2.4x10-4. Notably, the encrypted Pearson correlation between the smoker attribute and charges reaches 0.7873, with an MRE of 2.86x10-4. These results confirm the practical utility of PP-STAT for secure and precise statistical analysis in privacy-sensitive domains.
- Abstract(参考訳): クラウドコンピューティングの普及により、サードパーティプラットフォームに統計分析をアウトソーシングする必要性が急速に高まっている。
しかし、医療記録や財務情報などの機密データをクラウド環境で扱うことは、深刻なプライバシー上の懸念を引き起こす。
本稿では,プライバシー保護統計分析のための新しい,かつ効率的なホモモルフィック暗号(HE)ベースのフレームワークであるPP-STATを提案する。
HEは、基盤となる平文を明らかにすることなく、直接暗号化されたデータ上で計算を行うことができる。
PP-STATはZスコア正規化、歪度、曲率、変動係数、ピアソン相関係数などの高度な統計測度をサポートし、すべて暗号化データ上で安全に計算される。
そこで, PP-STATでは, 1) 逆二乗根演算を初期化するためのチェビシェフ近似法, (2) 定数スケーリング因子を折り畳み, 分散計算に分解することで乗算深度を減少させる事前正規化スケーリング法を導入している。
これらの技術は計算オーバーヘッドを大幅に減らし、高価なブートストラップ手順の数を最小化する。
実世界のデータセットを評価した結果,PP-STATは平均相対誤差(MRE)が2.4x10-4以下であることがわかった。
特に、スモーカー属性と電荷の暗号化されたピアソン相関は0.7873であり、MREは2.86x10-4である。
これらの結果は、プライバシに敏感なドメインの安全かつ正確な統計解析のためのPP-STATの実用性を確認するものである。
関連論文リスト
- Prediction-Powered Adaptive Shrinkage Estimation [0.9208007322096532]
予測パワー適応収縮(英: Prediction-Powered Adaptive Shrinkage、PAS)は、PPIを実証的なベイズ収縮で橋渡しし、複数の手段の推定を改善する手法である。
PASはML予測の信頼性に適応し、大規模アプリケーションにおいて従来のベースラインと現代的なベースラインを上回っている。
論文 参考訳(メタデータ) (2025-02-20T00:24:05Z) - Linear-Time User-Level DP-SCO via Robust Statistics [55.350093142673316]
ユーザレベルの差分プライベート凸最適化(DP-SCO)は、マシンラーニングアプリケーションにおけるユーザのプライバシ保護の重要性から、大きな注目を集めている。
微分プライベート勾配勾配(DP-SGD)に基づくような現在の手法は、しばしば高雑音蓄積と準最適利用に苦しむ。
これらの課題を克服するために、ロバストな統計、特に中央値とトリミング平均を利用する新しい線形時間アルゴリズムを導入する。
論文 参考訳(メタデータ) (2025-02-13T02:05:45Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - A novel Deep Learning approach for one-step Conformal Prediction
approximation [0.7646713951724009]
Conformal Prediction (CP) は、最小限の制約を与えられた最大エラー率を保証する汎用的なソリューションである。
本稿では,従来の2ステップCPアプローチを1ステップで近似する新しい共形損失関数を提案する。
論文 参考訳(メタデータ) (2022-07-25T17:46:09Z) - Differential privacy and robust statistics in high dimensions [49.50869296871643]
高次元Propose-Test-Release (HPTR) は指数的メカニズム、頑健な統計、Propose-Test-Release メカニズムという3つの重要なコンポーネントの上に構築されている。
本論文では,HPTRが複数のシナリオで最適サンプル複雑性をほぼ達成していることを示す。
論文 参考訳(メタデータ) (2021-11-12T06:36:40Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Differentially Private Federated Learning with Laplacian Smoothing [72.85272874099644]
フェデレートラーニングは、ユーザ間でプライベートデータを共有せずに、協調的にモデルを学習することで、データのプライバシを保護することを目的としている。
敵は、リリースしたモデルを攻撃することによって、プライベートトレーニングデータを推測することができる。
差別化プライバシは、トレーニングされたモデルの正確性や実用性を著しく低下させる価格で、このような攻撃に対する統計的保護を提供する。
論文 参考訳(メタデータ) (2020-05-01T04:28:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。