論文の概要: Robust factored principal component analysis for matrix-valued outlier
accommodation and detection
- arxiv url: http://arxiv.org/abs/2112.06760v1
- Date: Mon, 13 Dec 2021 16:12:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 15:25:40.499105
- Title: Robust factored principal component analysis for matrix-valued outlier
accommodation and detection
- Title(参考訳): ロバスト因数主成分分析による行列値外れ値の調節と検出
- Authors: Xuan Ma, Jianhua Zhao, Yue Wang
- Abstract要約: Factored PCA (FPCA) は行列データに対するPCAの確率的拡張である。
行列データに対するFPCA(RFPCA)の堅牢な拡張を提案する。
RFPCAは適応的に減量し、ロバストな推定値が得られる。
- 参考スコア(独自算出の注目度): 4.228971753938522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Principal component analysis (PCA) is a popular dimension reduction technique
for vector data. Factored PCA (FPCA) is a probabilistic extension of PCA for
matrix data, which can substantially reduce the number of parameters in PCA
while yield satisfactory performance. However, FPCA is based on the Gaussian
assumption and thereby susceptible to outliers. Although the multivariate $t$
distribution as a robust modeling tool for vector data has a very long history,
its application to matrix data is very limited. The main reason is that the
dimension of the vectorized matrix data is often very high and the higher the
dimension, the lower the breakdown point that measures the robustness. To solve
the robustness problem suffered by FPCA and make it applicable to matrix data,
in this paper we propose a robust extension of FPCA (RFPCA), which is built
upon a $t$-type distribution called matrix-variate $t$ distribution. Like the
multivariate $t$ distribution, the matrix-variate $t$ distribution can
adaptively down-weight outliers and yield robust estimates. We develop a fast
EM-type algorithm for parameter estimation. Experiments on synthetic and
real-world datasets reveal that RFPCA is compared favorably with several
related methods and RFPCA is a simple but powerful tool for matrix-valued
outlier detection.
- Abstract(参考訳): 主成分分析(PCA)はベクトルデータに対する一般的な次元削減手法である。
Factored PCA (FPCA) は、行列データに対するPCAの確率的拡張であり、PCAのパラメータ数を著しく削減し、良好な性能が得られる。
しかし、FPCAはガウスの仮定に基づいており、したがって外れ値に影響を受けやすい。
ベクトルデータのロバストなモデリングツールとしての多変量$t$分布は非常に長い歴史を持つが、行列データへの応用は非常に限られている。
主な理由は、ベクトル化された行列データの次元がしばしば非常に高く、次元が高いほど、ロバスト性を測定する分解点が低くなるからである。
本稿では,FPCAが抱えるロバスト性問題を行列データに適用するために,行列変数分布と呼ばれる$t$型分布上に構築したFPCA(RFPCA)のロバスト拡張を提案する。
多変量 $t$ 分布と同様に、行列変数 $t$ 分布は適応的にダウンウェイトの外れ値となり、堅牢な推定が得られる。
パラメータ推定のための高速em型アルゴリズムを開発した。
合成および実世界のデータセットに関する実験により、rfpcaはいくつかの関連する方法と比較され、rfpcaはマトリックス値の異常検出のためのシンプルで強力なツールであることが判明した。
関連論文リスト
- Robust bilinear factor analysis based on the matrix-variate $t$
distribution [2.6530267536011913]
$t$ディストリビューション($t$fa)に基づく因子分析は、重み付きまたは汚染されたデータの一般的な要因を抽出するのに有用である。
本稿では,$t$分布(t$bfa)に基づく新しいロバストな因子分析モデルを提案する。
重み付き行列データや汚染された行列データに対して、行変数と列変数の両方の共通要素を同時に抽出することができる。
論文 参考訳(メタデータ) (2024-01-04T11:15:44Z) - Sparse PCA with Oracle Property [115.72363972222622]
新規な正規化を伴うスパースPCAの半定緩和に基づく推定器群を提案する。
我々は、家族内の別の推定器が、スパースPCAの標準半定緩和よりも、より急激な収束率を達成することを証明した。
論文 参考訳(メタデータ) (2023-12-28T02:52:54Z) - Robust Principal Component Analysis using Density Power Divergence [8.057006406834466]
我々は、最小密度の電力分散推定器に基づく、新しいロバストPCA推定器を提案する。
提案手法は, 従来のPCA法と比較し, 広範囲なシミュレーションによって支持された。
論文 参考訳(メタデータ) (2023-09-24T02:59:39Z) - Large-scale gradient-based training of Mixtures of Factor Analyzers [67.21722742907981]
本稿では,勾配降下による高次元学習を効果的に行うための理論解析と新しい手法の両立に寄与する。
MFAトレーニングと推論/サンプリングは,学習終了後の行列逆変換を必要としない精度行列に基づいて行うことができることを示す。
理論解析と行列の他に,SVHNやMNISTなどの画像データセットにMFAを適用し,サンプル生成と外乱検出を行う能力を示す。
論文 参考訳(メタデータ) (2023-08-26T06:12:33Z) - Improved Privacy-Preserving PCA Using Optimized Homomorphic Matrix
Multiplication [0.0]
主成分分析(英: principal Component Analysis、PCA)は、機械学習とデータ分析の領域で広く利用されている重要な技術である。
近年,セキュアなクラウドコンピューティングシナリオにおいて,プライバシ保護型PCAアルゴリズムの同型暗号化を活用する取り組みが進められている。
本稿では,これらの制約に対処するプライバシー保護PCAに対して,従来の手法に比べて効率,精度,拡張性に優れる新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-27T02:51:20Z) - Nearly-Linear Time and Streaming Algorithms for Outlier-Robust PCA [43.106438224356175]
ほぼ最適誤差保証付き頑健なPCAのためのニア線形時間アルゴリズムを開発した。
また,メモリ使用量にほぼ線形なロバストPCAのためのシングルパスストリーミングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-05-04T04:45:16Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Unitary Approximate Message Passing for Matrix Factorization [90.84906091118084]
行列分解 (MF) を一定の制約で考慮し, 様々な分野の応用を見いだす。
我々は,効率の良いメッセージパッシング実装であるUAMPMFを用いて,MFに対するベイズ的アプローチを開発する。
UAMPMFは、回復精度、ロバスト性、計算複雑性の観点から、最先端のアルゴリズムを著しく上回ることを示す。
論文 参考訳(メタデータ) (2022-07-31T12:09:32Z) - A Linearly Convergent Algorithm for Distributed Principal Component
Analysis [12.91948651812873]
本稿では,1時間スケール分散pcaアルゴリズムである分散sanger's algorithm(dsa)を提案する。
提案アルゴリズムは真の解の近傍に線形収束することを示した。
論文 参考訳(メタデータ) (2021-01-05T00:51:14Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。