論文の概要: Robust and Differentially Private PCA for non-Gaussian data
- arxiv url: http://arxiv.org/abs/2507.15232v1
- Date: Mon, 21 Jul 2025 04:27:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.251826
- Title: Robust and Differentially Private PCA for non-Gaussian data
- Title(参考訳): 非ガウスデータに対するロバストおよび微分プライベートPCA
- Authors: Minwoo Kim, Sungkyu Jung,
- Abstract要約: 重み付きおよび潜在的に汚染されたデータに適用可能な微分プライベートPCA法を提案する。
有界変換を適用することにより、主成分の微分プライベートな計算が可能となる。
我々の手法は統計的有用性の観点から既存の手法より一貫して優れている。
- 参考スコア(独自算出の注目度): 3.744589644319257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances have sparked significant interest in the development of privacy-preserving Principal Component Analysis (PCA). However, many existing approaches rely on restrictive assumptions, such as assuming sub-Gaussian data or being vulnerable to data contamination. Additionally, some methods are computationally expensive or depend on unknown model parameters that must be estimated, limiting their accessibility for data analysts seeking privacy-preserving PCA. In this paper, we propose a differentially private PCA method applicable to heavy-tailed and potentially contaminated data. Our approach leverages the property that the covariance matrix of properly rescaled data preserves eigenvectors and their order under elliptical distributions, which include Gaussian and heavy-tailed distributions. By applying a bounded transformation, we enable straightforward computation of principal components in a differentially private manner. Additionally, boundedness guarantees robustness against data contamination. We conduct both theoretical analysis and empirical evaluations of the proposed method, focusing on its ability to recover the subspace spanned by the leading principal components. Extensive numerical experiments demonstrate that our method consistently outperforms existing approaches in terms of statistical utility, particularly in non-Gaussian or contaminated data settings.
- Abstract(参考訳): 近年の進歩は、プライバシ保護主成分分析(PCA)の発展に大きな関心を呼んだ。
しかし、多くの既存のアプローチは、ガウス以下のデータを仮定したり、データ汚染に弱いといった制限的な仮定に依存している。
さらに、いくつかの手法は計算コストがかかるか、未知のモデルパラメータに依存しているため、プライバシ保護PCAを求めるデータアナリストのアクセシビリティが制限される。
本稿では,重み付きおよび潜在的に汚染されたデータに適用可能な,微分プライベートなPCA手法を提案する。
提案手法は, 固有ベクトルとその順序を, ガウス分布と重み付き分布を含む楕円分布で保存する性質を利用する。
有界変換を適用することにより、主成分の微分プライベートな計算が可能となる。
さらに、境界性はデータ汚染に対する堅牢性を保証する。
提案手法の理論的解析と経験的評価を両立させ,主成分が分散した部分空間を復元する能力に着目した。
大規模な数値実験により, 統計的有用性, 特に非ガウス的, 汚染されたデータ設定において, 既存の手法よりも常に優れることが示された。
関連論文リスト
- Assumption-Lean Post-Integrated Inference with Negative Control Outcomes [0.0]
負の制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
提案手法は,予測された直接効果推定値,隠された仲介者,共同設立者,モデレーターまで拡張する。
提案された二重頑健な推定器は、最小の仮定と潜在的な不特定性の下で一貫性があり、効率的である。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Efficient Conformal Prediction under Data Heterogeneity [79.35418041861327]
コンフォーマル予測(CP)は不確実性定量化のための頑健な枠組みである。
非交換性に対処するための既存のアプローチは、最も単純な例を超えて計算不可能なメソッドにつながる。
この研究は、比較的一般的な非交換可能なデータ分布に対して証明可能な信頼セットを生成する、CPに新しい効率的なアプローチを導入する。
論文 参考訳(メタデータ) (2023-12-25T20:02:51Z) - Adaptive Differentially Quantized Subspace Perturbation (ADQSP): A Unified Framework for Privacy-Preserving Distributed Average Consensus [6.364764301218972]
本稿では適応微分量子化部分空間(ADQSP)という一般手法を提案する。
本研究では,単一の量子化パラメータを変化させることで,提案手法がSMPC型の性能とDP型性能に異なることを示す。
この結果から,従来の分散信号処理ツールを暗号保証に活用する可能性が示唆された。
論文 参考訳(メタデータ) (2023-12-13T07:52:16Z) - On the Privacy-Robustness-Utility Trilemma in Distributed Learning [7.778461949427662]
本稿では,少数の対向マシンに対してロバスト性を保証するアルゴリズムによって得られた誤差を,まず厳密に解析する。
私たちの分析は、プライバシ、堅牢性、ユーティリティの基本的なトレードオフを示しています。
論文 参考訳(メタデータ) (2023-02-09T17:24:18Z) - Stochastic and Private Nonconvex Outlier-Robust PCA [11.688030627514532]
外乱PCAは、外乱で破損したデータセットから下層の低次元線形部分空間を求める。
提案手法は,測地線降下と新しい収束解析を含む手法を含むことを示す。
メインの応用法は、アウトリアロバストPCAのための効果的にプライベートなアルゴリズムである。
論文 参考訳(メタデータ) (2022-03-17T12:00:47Z) - Inference for Heteroskedastic PCA with Missing Data [16.54456304614719]
本稿では,主成分分析(PCA)のための信頼性領域を高データセットで構築する方法を示す。
我々はヘテロPCAの非漸近分布保証を開発し、これらが主部分空間の両信頼領域を計算するためにどのように呼び出されるかを実証する。
論文 参考訳(メタデータ) (2021-07-26T17:59:01Z) - Incorporating Causal Graphical Prior Knowledge into Predictive Modeling
via Simple Data Augmentation [92.96204497841032]
因果グラフ(CG)は、データ分散の背後にあるデータ生成プロセスの知識のコンパクトな表現である。
本研究では,条件付き独立性(CI)関係の事前知識を活用可能なモデルに依存しないデータ拡張手法を提案する。
本手法は,小データシステムにおける予測精度の向上に有効であることを実験的に示した。
論文 参考訳(メタデータ) (2021-02-27T06:13:59Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。