論文の概要: Robust Multilinear Principal Component Analysis
- arxiv url: http://arxiv.org/abs/2503.07327v1
- Date: Mon, 10 Mar 2025 13:41:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:47:06.686402
- Title: Robust Multilinear Principal Component Analysis
- Title(参考訳): ロバスト多線形主成分分析
- Authors: Mehdi Hirari, Fabio Centofanti, Mia Hubert, Stefan Van Aelst,
- Abstract要約: マルチ線形主成分分析(MPCA)はテンソルデータを解析するための重要なツールである。
標準MPCAは外れ値に敏感である。
本稿では,両タイプのアウトレイラを同時に処理できる新しい堅牢MPCA法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Multilinear Principal Component Analysis (MPCA) is an important tool for analyzing tensor data. It performs dimension reduction similar to PCA for multivariate data. However, standard MPCA is sensitive to outliers. It is highly influenced by observations deviating from the bulk of the data, called casewise outliers, as well as by individual outlying cells in the tensors, so-called cellwise outliers. This latter type of outlier is highly likely to occur in tensor data, as tensors typically consist of many cells. This paper introduces a novel robust MPCA method that can handle both types of outliers simultaneously, and can cope with missing values as well. This method uses a single loss function to reduce the influence of both casewise and cellwise outliers. The solution that minimizes this loss function is computed using an iteratively reweighted least squares algorithm with a robust initialization. Graphical diagnostic tools are also proposed to identify the different types of outliers that have been found by the new robust MPCA method. The performance of the method and associated graphical displays is assessed through simulations and illustrated on two real datasets.
- Abstract(参考訳): マルチ線形主成分分析(MPCA)はテンソルデータを解析するための重要なツールである。
多変量データに対するPCAと同様の次元縮小を行う。
しかし、標準MPCAは外れ値に敏感である。
これは、ケースワイズ・アウトリーチと呼ばれるデータの大部分から逸脱する観測や、テンソル内の個々の細胞、いわゆるセルワイズ・アウトリーの影響を強く受けている。
この後者の型は、テンソルが典型的には多くの細胞から構成されているため、テンソルデータで発生する可能性が高い。
本稿では,両タイプのアウトレーラを同時に処理し,欠落した値にも対処可能な,新しい頑健なMPCA手法を提案する。
この方法は、単一損失関数を用いて、ケースワイドとセルワイドの両方のアウトリーの影響を低減する。
この損失関数を最小化する解は、頑健な初期化を伴う反復再重み付き最小二乗アルゴリズムを用いて計算される。
グラフィカル診断ツールも提案され、新しいロバストMPCA法で発見された様々な種類のアウトリーチを同定する。
この手法と関連するグラフィカルディスプレイの性能はシミュレーションによって評価され、2つの実際のデータセットで説明される。
関連論文リスト
- Adversarial Dependence Minimization [78.36795688238155]
この研究は、線形対のデコリレーションを超越した依存最小化のための微分可能でスケーラブルなアルゴリズムを提供する。
我々は,PCAを非線形デコリレーションに拡張し,画像分類法の一般化を改良し,自己教師あり表現学習における次元的崩壊を防止する3つのアプリケーションでその実用性を実証する。
論文 参考訳(メタデータ) (2025-02-05T14:43:40Z) - Fast and Provable Tensor Robust Principal Component Analysis via Scaled
Gradient Descent [30.299284742925852]
本稿では、テンソルロバスト主成分分析(RPCA)に取り組む。
希少な腐敗によって汚染された観測から低ランクのテンソルを回収することを目的としている。
提案アルゴリズムは, 最先端行列やテンソルRPCAアルゴリズムよりも, より優れた, よりスケーラブルな性能を実現する。
論文 参考訳(メタデータ) (2022-06-18T04:01:32Z) - Capturing the Denoising Effect of PCA via Compression Ratio [3.967854215226183]
主成分分析(PCA)は機械学習における最も基本的なツールの1つである。
本稿では,PCAが高次元雑音データに与える影響を捉えるために,Emphcompression ratioと呼ばれる新しい指標を提案する。
この新しい指標に基づいて、我々は、外れ値を検出するのに使える簡単なアルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-04-22T18:43:47Z) - Robust factored principal component analysis for matrix-valued outlier
accommodation and detection [4.228971753938522]
Factored PCA (FPCA) は行列データに対するPCAの確率的拡張である。
行列データに対するFPCA(RFPCA)の堅牢な拡張を提案する。
RFPCAは適応的に減量し、ロバストな推定値が得られる。
論文 参考訳(メタデータ) (2021-12-13T16:12:22Z) - Pre-treatment of outliers and anomalies in plant data: Methodology and
case study of a Vacuum Distillation Unit [5.728037880354686]
短期値(誤データ、ノイズ)と長期値(例えば長期間の故障)の2種類が検討された。
我々は3$sigma$メソッドが時系列全体に適用される3$sigma$メソッドよりも、短期的な外れ値検出により良いアプローチを提供することを示した。
論文 参考訳(メタデータ) (2021-06-17T11:17:29Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Attentional-Biased Stochastic Gradient Descent [74.49926199036481]
深層学習におけるデータ不均衡やラベルノイズ問題に対処するための証明可能な手法(ABSGD)を提案する。
本手法は運動量SGDの簡易な修正であり,各試料に個別の重み付けを行う。
ABSGDは追加コストなしで他の堅牢な損失と組み合わせられるほど柔軟である。
論文 参考訳(メタデータ) (2020-12-13T03:41:52Z) - Piecewise Linear Regression via a Difference of Convex Functions [50.89452535187813]
本稿では,データに対する凸関数(DC関数)の差を利用した線形回帰手法を提案する。
実際に実装可能であることを示すとともに,実世界のデータセット上で既存の回帰/分類手法に匹敵する性能を有することを実証的に検証した。
論文 参考訳(メタデータ) (2020-07-05T18:58:47Z) - Spectral Learning on Matrices and Tensors [74.88243719463053]
テンソル分解は行列法で欠落する潜伏効果を拾うことができることを示す。
また,効率的なテンソル分解法を設計するための計算手法についても概説する。
論文 参考訳(メタデータ) (2020-04-16T22:53:00Z) - Improved guarantees and a multiple-descent curve for Column Subset
Selection and the Nystr\"om method [76.73096213472897]
我々は,データ行列のスペクトル特性を利用して近似保証を改良する手法を開発した。
我々のアプローチは、特異値減衰の既知の速度を持つデータセットのバウンダリが大幅に向上する。
RBFパラメータを変更すれば,改良された境界線と多重発振曲線の両方を実データセット上で観測できることが示される。
論文 参考訳(メタデータ) (2020-02-21T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。