論文の概要: Robust Principal Component Analysis using Density Power Divergence
- arxiv url: http://arxiv.org/abs/2309.13531v1
- Date: Sun, 24 Sep 2023 02:59:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 19:12:03.860937
- Title: Robust Principal Component Analysis using Density Power Divergence
- Title(参考訳): 密度パワー発散を利用したロバスト主成分分析
- Authors: Subhrajyoty Roy, Ayanendranath Basu and Abhik Ghosh
- Abstract要約: 我々は、最小密度の電力分散推定器に基づく、新しいロバストPCA推定器を提案する。
提案手法は, 従来のPCA法と比較し, 広範囲なシミュレーションによって支持された。
- 参考スコア(独自算出の注目度): 8.057006406834466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Principal component analysis (PCA) is a widely employed statistical tool used
primarily for dimensionality reduction. However, it is known to be adversely
affected by the presence of outlying observations in the sample, which is quite
common. Robust PCA methods using M-estimators have theoretical benefits, but
their robustness drop substantially for high dimensional data. On the other end
of the spectrum, robust PCA algorithms solving principal component pursuit or
similar optimization problems have high breakdown, but lack theoretical
richness and demand high computational power compared to the M-estimators. We
introduce a novel robust PCA estimator based on the minimum density power
divergence estimator. This combines the theoretical strength of the
M-estimators and the minimum divergence estimators with a high breakdown
guarantee regardless of data dimension. We present a computationally efficient
algorithm for this estimate. Our theoretical findings are supported by
extensive simulations and comparisons with existing robust PCA methods. We also
showcase the proposed algorithm's applicability on two benchmark datasets and a
credit card transactions dataset for fraud detection.
- Abstract(参考訳): 主成分分析(PCA)は、主に次元の減少に使用される統計ツールである。
しかし、サンプル中の外部観察の存在によって悪影響を受けることが知られており、非常に一般的である。
M推定器を用いたロバストPCA法は理論的利点があるが、そのロバスト性は高次元データに対して著しく低下する。
一方、主成分探索や類似の最適化問題を解く頑健なPCAアルゴリズムは、理論的な豊かさを欠き、M推定器に比べて高い計算力を必要とする。
我々は、最小密度の電力分散推定器に基づく、新しいロバストPCA推定器を提案する。
これは、M推定器と最小分散推定器の理論的強度を、データ次元に関係なく高い分解保証と組み合わせる。
この推定のために計算効率の良いアルゴリズムを提案する。
提案手法は,従来のPCA法との比較とシミュレーションにより裏付けられた。
また、2つのベンチマークデータセットと不正検出のためのクレジットカードトランザクションデータセットに提案アルゴリズムの適用性を示す。
関連論文リスト
- Learning-Augmented K-Means Clustering Using Dimensional Reduction [1.7243216387069678]
主成分分析(PCA)を用いたデータセットの次元性低減手法を提案する。
PCAは文献でよく確立されており、データモデリング、圧縮、可視化の最も有用なツールの1つになっている。
論文 参考訳(メタデータ) (2024-01-06T12:02:33Z) - Sparse PCA with Oracle Property [115.72363972222622]
新規な正規化を伴うスパースPCAの半定緩和に基づく推定器群を提案する。
我々は、家族内の別の推定器が、スパースPCAの標準半定緩和よりも、より急激な収束率を達成することを証明した。
論文 参考訳(メタデータ) (2023-12-28T02:52:54Z) - Doubly Robust Instance-Reweighted Adversarial Training [107.40683655362285]
本稿では,2重のインスタンス再重み付き対向フレームワークを提案する。
KL偏差正規化損失関数の最適化により重みを求める。
提案手法は, 平均ロバスト性能において, 最先端のベースライン法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-01T06:16:18Z) - Nearly-Linear Time and Streaming Algorithms for Outlier-Robust PCA [43.106438224356175]
ほぼ最適誤差保証付き頑健なPCAのためのニア線形時間アルゴリズムを開発した。
また,メモリ使用量にほぼ線形なロバストPCAのためのシングルパスストリーミングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-05-04T04:45:16Z) - Robust factored principal component analysis for matrix-valued outlier
accommodation and detection [4.228971753938522]
Factored PCA (FPCA) は行列データに対するPCAの確率的拡張である。
行列データに対するFPCA(RFPCA)の堅牢な拡張を提案する。
RFPCAは適応的に減量し、ロバストな推定値が得られる。
論文 参考訳(メタデータ) (2021-12-13T16:12:22Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Doing Great at Estimating CATE? On the Neglected Assumptions in
Benchmark Comparisons of Treatment Effect Estimators [91.3755431537592]
もっとも単純な設定であっても、無知性仮定に基づく推定は誤解を招く可能性があることを示す。
異種処理効果評価のための機械学習ベンチマークデータセットを2つ検討した。
ベンチマークデータセットの固有の特性が、他のものよりもいくつかのアルゴリズムを好んでいる点を強調します。
論文 参考訳(メタデータ) (2021-07-28T13:21:27Z) - Robust Principal Component Analysis: A Median of Means Approach [17.446104539598895]
主成分分析(main Component Analysis)は、データビジュアライゼーション、デノイング、次元削減のためのツールである。
最近の教師付き学習手法は、外見的な観察を扱う上で大きな成功を収めている。
本稿では,MoM原理に基づくPCA手法を提案する。
論文 参考訳(メタデータ) (2021-02-05T19:59:05Z) - Modal Principal Component Analysis [3.050919759387985]
平均推定の代わりにモード推定を用いて,多くの統計的手法のロバスト性を向上できることが示されている。
本研究では,モード推定に基づく頑健なPCA手法であるMPCAを提案する。
論文 参考訳(メタデータ) (2020-08-07T23:59:05Z) - Approximation Algorithms for Sparse Principal Component Analysis [57.5357874512594]
主成分分析(PCA)は、機械学習と統計学において広く使われている次元削減手法である。
スパース主成分分析(Sparse principal Component Analysis)と呼ばれる,スパース主成分負荷を求める様々な手法が提案されている。
本研究では,SPCA問題に対するしきい値の精度,時間,近似アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-23T04:25:36Z) - $\gamma$-ABC: Outlier-Robust Approximate Bayesian Computation Based on a
Robust Divergence Estimator [95.71091446753414]
最寄りの$gamma$-divergence推定器をデータ差分尺度として用いることを提案する。
本手法は既存の不一致対策よりも高いロバスト性を実現する。
論文 参考訳(メタデータ) (2020-06-13T06:09:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。