論文の概要: Heavy-Tailed Principle Component Analysis
- arxiv url: http://arxiv.org/abs/2603.11308v1
- Date: Wed, 11 Mar 2026 21:07:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.649264
- Title: Heavy-Tailed Principle Component Analysis
- Title(参考訳): 重り付き原理成分分析
- Authors: Mario Sayde, Christopher Khater, Jihad Fahs, Ibrahim Abou-Faycal,
- Abstract要約: 我々は、$mathbfX = A1/2mathbfG$という形の超統計依存モデルに基づいて生成された高次元データのPCAについて検討する。
対数損失の下でPCAを定式化し、モーメントが存在しない場合でも適切に定義する。
本研究の主理論的結果は,この損失下での重尾観測の主成分は,標準PCAを用いて得られたものと一致していることを示している。
- 参考スコア(独自算出の注目度): 0.8866338330056278
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Principal Component Analysis (PCA) is a cornerstone of dimensionality reduction, yet its classical formulation relies critically on second-order moments and is therefore fragile in the presence of heavy-tailed data and impulsive noise. While numerous robust PCA variants have been proposed, most either assume finite variance, rely on sparsity-driven decompositions, or address robustness through surrogate loss functions without a unified treatment of infinite-variance models. In this paper, we study PCA for high-dimensional data generated according to a superstatistical dependent model of the form $\mathbf{X} = A^{1/2}\mathbf{G}$, where $A$ is a positive random scalar and $\mathbf{G}$ is a Gaussian vector. This framework captures a wide class of heavy-tailed distributions, including multivariate $t$ and sub-Gaussian $α$-stable laws. We formulate PCA under a logarithmic loss, which remains well defined even when moments do not exist. Our main theoretical result shows that, under this loss, the principal components of the heavy-tailed observations coincide with those obtained by applying standard PCA to the covariance matrix of the underlying Gaussian generator. Building on this insight, we propose robust estimators for this covariance matrix directly from heavy-tailed data and compare them with the empirical covariance and Tyler's scatter estimator. Extensive experiments, including background denoising tasks, demonstrate that the proposed approach reliably recovers principal directions and significantly outperforms classical PCA in the presence of heavy-tailed and impulsive noise, while remaining competitive under Gaussian noise.
- Abstract(参考訳): 主成分分析(PCA)は次元の減少の基盤であるが、古典的な定式化は2次モーメントに極めて依存しており、重み付きデータや衝動雑音の存在下で脆弱である。
多くのロバストPCA変種が提案されているが、ほとんどの場合有限分散を仮定し、スパーシティ駆動分解に依存するか、無限分散モデルの統一的な処理を伴わないサロゲート損失関数によるロバスト性に対処する。
本稿では,$A$が正のランダムスカラーであり$\mathbf{G}$がガウスベクトルである場合,$\mathbf{X} = A^{1/2}\mathbf{G}$という形の超統計依存モデルに基づいて生成された高次元データのPCAについて検討する。
このフレームワークは多変量$t$と準ガウス$α$stable法則を含む幅広い重み付き分布をキャプチャする。
対数損失の下でPCAを定式化し、モーメントが存在しない場合でも適切に定義する。
本研究の主理論的結果は, 重尾観測の主成分は, 基礎となるガウス発生器の共分散行列に標準PCAを適用したものと一致することを示した。
この知見に基づいて、重み付きデータから直接この共分散行列のロバストな推定器を提案し、それらを経験的共分散とタイラーの散乱推定器と比較する。
背景消音タスクを含む広範囲な実験により,提案手法は主方向を確実に回復し,ガウス雑音下での競合を保ちながら,重尾音や衝動音の存在下で古典的PCAを著しく上回っていることが示された。
関連論文リスト
- On the Computational Complexity of Performative Prediction [59.584063949469645]
我々は、$$-performatively stable pointの計算がPPAD完全であることを示す。
我々の重要な技術的貢献の1つは、PPAD-hardnessの結果を一般的な凸領域に拡張することである。
論文 参考訳(メタデータ) (2026-01-28T02:26:35Z) - The $φ$-PCA Framework: A Unified and Efficiency-Preserving Approach with Robust Variants [0.0]
我々は、ロバストで分散したPCAの統一的な定式化を提供する$phi$-PCAフレームワークを紹介した。
我々は,$phi$-PCAの根底にある分割集約原理が,ロバストで効率的な保存手法を開発するための一般的な戦略であることを示す。
論文 参考訳(メタデータ) (2025-10-15T05:21:11Z) - T-Rex: Fitting a Robust Factor Model via Expectation-Maximization [0.0]
統計的因子モデルに頑健に適合する新しい予測最大化(EM)アルゴリズムを提案する。
我々のアプローチは、楕円分布に対する散乱行列のタイラーのM-推定器に基づいている。
合成例と実例の両方について数値実験を行った。
論文 参考訳(メタデータ) (2025-05-17T18:53:06Z) - Sparse PCA with Oracle Property [115.72363972222622]
新規な正規化を伴うスパースPCAの半定緩和に基づく推定器群を提案する。
我々は、家族内の別の推定器が、スパースPCAの標準半定緩和よりも、より急激な収束率を達成することを証明した。
論文 参考訳(メタデータ) (2023-12-28T02:52:54Z) - Conformal inference for regression on Riemannian Manifolds [45.560812800359685]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、共変変数が$X$で、ユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - A Robustness Analysis of Blind Source Separation [91.3755431537592]
ブラインドソース分離(BSS)は、変換$f$が可逆であるが未知であるという条件の下で、その混合である$X=f(S)$から観測されていない信号を復元することを目的としている。
このような違反を分析し、その影響を$X$から$S$のブラインドリカバリに与える影響を定量化するための一般的なフレームワークを提案する。
定義された構造的仮定からの偏差に対する一般的なBSS溶出は、明示的な連続性保証という形で、利益的に分析可能であることを示す。
論文 参考訳(メタデータ) (2023-03-17T16:30:51Z) - Bayes-optimal limits in structured PCA, and how to reach them [21.3083877172595]
本研究では,主成分分析(PCA)のパラダイム行列モデルについて検討し,次数1の行列が付加雑音によって劣化することを示した。
このモデルにおいて、ベイズ-最適推論の極限を初めて特徴づける。
本稿では、適応的Thouless-Anderson-Palmer方程式の理論に着想を得た、新しい近似メッセージパッシングアルゴリズム(AMP)を提案する。
論文 参考訳(メタデータ) (2022-10-03T21:31:41Z) - Entrywise Recovery Guarantees for Sparse PCA via Sparsistent Algorithms [9.112172220055431]
一般的な高次元のガウス設計の下で、スパースPCAに対して入出力$ell_2,infty$boundsを提供する。
提案手法は,確率の高い正しいサポートを選択するアルゴリズムであり,スパーシスタントなアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-08T18:50:35Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Enhanced Principal Component Analysis under A Collaborative-Robust
Framework [89.28334359066258]
重み学習とロバストな損失を非自明な方法で組み合わせる,一般的な協調ロバスト重み学習フレームワークを提案する。
提案されたフレームワークでは、トレーニング中の重要度を示す適切なサンプルの一部のみがアクティブになり、エラーが大きい他のサンプルは無視されません。
特に、不活性化試料の負の効果はロバスト損失関数によって軽減される。
論文 参考訳(メタデータ) (2021-03-22T15:17:37Z) - An $\ell_p$ theory of PCA and spectral clustering [23.90245234027558]
主成分分析は統計と機械学習において強力なツールである。
本稿では、ヒルベルト空間におけるPCAの中空バージョンに対する$ell_p$理論を開発する。
文脈的コミュニティ検出のために、$ell_p$理論は、正確な回復のための情報しきい値を達成する単純なスペクトルアルゴリズムに導かれる。
論文 参考訳(メタデータ) (2020-06-24T21:30:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。