論文の概要: Robust Principal Component Analysis: A Median of Means Approach
- arxiv url: http://arxiv.org/abs/2102.03403v1
- Date: Fri, 5 Feb 2021 19:59:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:52:28.088785
- Title: Robust Principal Component Analysis: A Median of Means Approach
- Title(参考訳): ロバスト主成分分析:平均的アプローチの中央値
- Authors: Debolina Paul, Saptarshi Chakraborty and Swagatam Das
- Abstract要約: 主成分分析(PCA)は、データ可視化、デノイング、次元縮小のためのツールである。
メディア・オブ・ミーンズ(MoM)哲学に倣って,近年の教師付き学習手法は,外的観察を扱う上で大きな成功を収めている。
本稿では,MoM の原理に基づく PCA 手法を提案する。提案手法は,MoMPCA (Median of Means principal Component Analysis) と呼ばれ,計算的に魅力的であるだけでなく,最小限の仮定下での最適収束率も達成する。
- 参考スコア(独自算出の注目度): 16.0817847880416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Principal Component Analysis (PCA) is a fundamental tool for data
visualization, denoising, and dimensionality reduction. It is widely popular in
Statistics, Machine Learning, Computer Vision, and related fields. However, PCA
is well known to fall prey to the presence of outliers and often fails to
detect the true underlying low-dimensional structure within the dataset. Recent
supervised learning methods, following the Median of Means (MoM) philosophy,
have shown great success in dealing with outlying observations without much
compromise to their large sample theoretical properties. In this paper, we
propose a PCA procedure based on the MoM principle. Called the Median of Means
Principal Component Analysis (MoMPCA), the proposed method is not only
computationally appealing but also achieves optimal convergence rates under
minimal assumptions. In particular, we explore the non-asymptotic error bounds
of the obtained solution via the aid of Vapnik-Chervonenkis theory and
Rademacher complexity, while granting absolutely no assumption on the outlying
observations. The efficacy of the proposal is also thoroughly showcased through
simulations and real data applications.
- Abstract(参考訳): 主成分分析(PCA)は、データの可視化、復調、次元化のための基本的なツールである。
統計学、機械学習、コンピュータビジョン、および関連分野で広く普及しています。
しかし、PCAは外れ値の存在を捕食することがよく知られており、しばしばデータセット内の真の下層の低次元構造を検出するのに失敗する。
最近の教師付き学習法は、平均中央(MoM)哲学に従い、その大きなサンプル理論特性にあまり妥協することなく、外部観察を扱うことに成功しました。
本稿では,MoM原理に基づくPCA手順を提案する。
平均主成分分析の中央値 (mompca) と呼ばれ、提案手法は計算上魅力的であるばかりでなく、最小の仮定の下で最適収束率を達成する。
特に,vapnik-chervonenkis理論とrademacher複雑性の助けを借りて,得られた解の非漸近的誤差境界を探索する。
提案の有効性はシミュレーションや実データアプリケーションを通じて徹底的に実証されている。
関連論文リスト
- Statistical Analysis of Karcher Means for Random Restricted PSD Matrices [5.867823829398135]
本稿では,制限された正の半定値行列の多様体上の固有平均モデルについて検討し,カルチャー平均の漸近的統計解析を提供する。
アプリケーションとして,分散主成分分析アルゴリズムであるLRC-dPCAが,全サンプルPCAアルゴリズムと同じ性能を実現することを示す。
論文 参考訳(メタデータ) (2023-02-24T03:13:12Z) - Support Recovery in Sparse PCA with Non-Random Missing Data [27.3669650952144]
非ランダムサンプリング方式の下で,不完全かつノイズの多いデータに基づいてスパースPCAの実用的なアルゴリズムを解析する。
理論的には、ある条件下では、スパースリード固有ベクトルの支持を高い確率で回復することができる。
提案アルゴリズムは, 観察された成分が良好な構造特性を持つ場合, その他のスパースPCA手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-02-03T04:20:25Z) - Asymptotically Unbiased Instance-wise Regularized Partial AUC
Optimization: Theory and Algorithm [101.44676036551537]
One-way partial AUC (OPAUC) と Two-way partial AUC (TPAUC) はバイナリ分類器の平均性能を測定する。
既存の手法のほとんどはPAUCをほぼ最適化するしかなく、制御不能なバイアスにつながる。
本稿では,分散ロバスト最適化AUCによるPAUC問題の簡易化について述べる。
論文 参考訳(メタデータ) (2022-10-08T08:26:22Z) - Bayes-optimal limits in structured PCA, and how to reach them [21.3083877172595]
本稿では,主成分分析のパラダイム的スパイク行列モデルについて検討する。
我々の研究は、構造的雑音を伴うこのモデルにおける推論のためのベイズ最適極限の最初の特徴を与える。
論文 参考訳(メタデータ) (2022-10-03T21:31:41Z) - Support Recovery in Sparse PCA with Incomplete Data [27.3669650952144]
主成分分析(PCA)不完全データに対する実用的アルゴリズムを用いる。
未知の真のSDPが不完全支持行列を正確に復元できるという理論的および実験的証拠を提供する。
不完全データを用いて理論結果を検証し、分散表現において有意義な結果を示す。
論文 参考訳(メタデータ) (2022-05-30T16:17:39Z) - Entropy Minimizing Matrix Factorization [102.26446204624885]
NMF(Nonnegative Matrix Factorization)は、広く使用されているデータ分析技術であり、多くの実際のタスクで印象的な結果をもたらしました。
本研究では,上述の問題に対処するために,EMMF (Entropy Minimizing Matrix Factorization framework) を開発した。
通常、外れ値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立される。
論文 参考訳(メタデータ) (2021-03-24T21:08:43Z) - Enhanced Principal Component Analysis under A Collaborative-Robust
Framework [89.28334359066258]
重み学習とロバストな損失を非自明な方法で組み合わせる,一般的な協調ロバスト重み学習フレームワークを提案する。
提案されたフレームワークでは、トレーニング中の重要度を示す適切なサンプルの一部のみがアクティブになり、エラーが大きい他のサンプルは無視されません。
特に、不活性化試料の負の効果はロバスト損失関数によって軽減される。
論文 参考訳(メタデータ) (2021-03-22T15:17:37Z) - Continuous Wasserstein-2 Barycenter Estimation without Minimax
Optimization [94.18714844247766]
ワッサーシュタイン・バリセンターは、最適輸送に基づく確率測度の重み付き平均の幾何学的概念を提供する。
本稿では,Wasserstein-2 バリセンタのサンプルアクセスを演算するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-02T21:01:13Z) - Modal Principal Component Analysis [3.050919759387985]
平均推定の代わりにモード推定を用いて,多くの統計的手法のロバスト性を向上できることが示されている。
本研究では,モード推定に基づく頑健なPCA手法であるMPCAを提案する。
論文 参考訳(メタデータ) (2020-08-07T23:59:05Z) - Approximation Algorithms for Sparse Principal Component Analysis [57.5357874512594]
主成分分析(PCA)は、機械学習と統計学において広く使われている次元削減手法である。
スパース主成分分析(Sparse principal Component Analysis)と呼ばれる,スパース主成分負荷を求める様々な手法が提案されている。
本研究では,SPCA問題に対するしきい値の精度,時間,近似アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-23T04:25:36Z) - A Robust Functional EM Algorithm for Incomplete Panel Count Data [66.07942227228014]
完全無作為な仮定(MCAR)の下での数え上げ過程の平均関数を推定する機能的EMアルゴリズムを提案する。
提案アルゴリズムは、いくつかの一般的なパネル数推定手法をラップし、不完全数にシームレスに対処し、ポアソン過程の仮定の誤特定に頑健である。
本稿では, 数値実験による提案アルゴリズムの有用性と喫煙停止データの解析について述べる。
論文 参考訳(メタデータ) (2020-03-02T20:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。