論文の概要: Principal Component Analysis Based on T$\ell_1$-norm Maximization
- arxiv url: http://arxiv.org/abs/2005.12263v1
- Date: Sat, 23 May 2020 04:28:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 03:17:49.001870
- Title: Principal Component Analysis Based on T$\ell_1$-norm Maximization
- Title(参考訳): T$\ell_1$-norm最大化に基づく主成分分析
- Authors: Xiang-Fei Yang, Yuan-Hai Shao, Chun-Na Li, Li-Ming Liu, Nai-Yang Deng
- Abstract要約: 古典的主成分分析(PCA)は、外れ値やノイズに対する感度に悩まされることがある。
PCAは$ell_p$-normをベースとしています。
数値実験により,PCA-$ell_p$および$ell_p$SPCAよりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 9.551146303706677
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classical principal component analysis (PCA) may suffer from the sensitivity
to outliers and noise. Therefore PCA based on $\ell_1$-norm and $\ell_p$-norm
($0 < p < 1$) have been studied. Among them, the ones based on $\ell_p$-norm
seem to be most interesting from the robustness point of view. However, their
numerical performance is not satisfactory. Note that, although T$\ell_1$-norm
is similar to $\ell_p$-norm ($0 < p < 1$) in some sense, it has the stronger
suppression effect to outliers and better continuity. So PCA based on
T$\ell_1$-norm is proposed in this paper. Our numerical experiments have shown
that its performance is superior than PCA-$\ell_p$ and $\ell_p$SPCA as well as
PCA, PCA-$\ell_1$ obviously.
- Abstract(参考訳): 古典的主成分分析(PCA)は、外れ値やノイズに対する感度に悩まされる。
したがって、$\ell_1$-normと$\ell_p$-norm(0 < p < 1$)に基づくPCAが研究されている。
その中でも、$\ell_p$-normに基づくものがロバスト性の観点から最も興味深いようである。
しかし、その数値性能は満足できない。
なお、t$\ell_1$-norm は、ある意味では$\ell_p$-norm (0 < p < 1$) に似ているが、外れ値に対するより強い抑制効果とより良い連続性を持つ。
そこで本論文では,T$\ell_1$-normに基づくPCAを提案する。
数値実験により,PCA-$\ell_p$と$\ell_p$SPCAとPCA,PCA-$\ell_1$より優れた性能を示した。
関連論文リスト
- Optimal Sketching for Residual Error Estimation for Matrix and Vector Norms [50.15964512954274]
線形スケッチを用いた行列とベクトルノルムの残差誤差推定問題について検討する。
これは、前作とほぼ同じスケッチサイズと精度で、経験的にかなり有利であることを示す。
また、スパースリカバリ問題に対して$Omega(k2/pn1-2/p)$低いバウンダリを示し、これは$mathrmpoly(log n)$ factorまで厳密である。
論文 参考訳(メタデータ) (2024-08-16T02:33:07Z) - Mind the Gap: A Causal Perspective on Bias Amplification in Prediction & Decision-Making [58.06306331390586]
本稿では,閾値演算による予測値がS$変化の程度を測るマージン補数の概念を導入する。
適切な因果仮定の下では、予測スコア$S$に対する$X$の影響は、真の結果$Y$に対する$X$の影響に等しいことを示す。
論文 参考訳(メタデータ) (2024-05-24T11:22:19Z) - On the $O(\frac{\sqrt{d}}{T^{1/4}})$ Convergence Rate of RMSProp and Its Momentum Extension Measured by $\ell_1$ Norm [59.65871549878937]
本稿では、RMSPropとその運動量拡張を考察し、$frac1Tsum_k=1Tの収束速度を確立する。
我々の収束率は、次元$d$を除くすべての係数に関して下界と一致する。
収束率は$frac1Tsum_k=1Tと類似していると考えられる。
論文 参考訳(メタデータ) (2024-02-01T07:21:32Z) - Deflated HeteroPCA: Overcoming the curse of ill-conditioning in heteroskedastic PCA [17.75853665586128]
本稿では,汚染されたデータからmathbbRn_1times n$の低ランク行列$boldsymbolXstarの列部分空間を推定することに関心がある。
信号-雑音比 (SNR) の広帯域化を図りながら, 最適な統計的精度を得る方法は困難である。
論文 参考訳(メタデータ) (2023-03-10T20:22:18Z) - Resampling Sensitivity of High-Dimensional PCA [7.436169208279454]
主成分分析(PCA)における再サンプリング感度の検討
我々は,PCAが入力データに敏感であることを示す。
論文 参考訳(メタデータ) (2022-12-30T03:13:04Z) - Near-optimal fitting of ellipsoids to random points [68.12685213894112]
楕円体をランダムな点に合わせるという基本的な問題は、低ランク行列分解、独立成分分析、主成分分析に関係している。
我々はこの予想を、ある$n = Omega(, d2/mathrmpolylog(d))$ に対する適合楕円体を構成することで対数的因子まで解決する。
我々の証明は、ある非標準確率行列の便利な分解を用いて、サンダーソン等最小二乗構成の実現可能性を示す。
論文 参考訳(メタデータ) (2022-08-19T18:00:34Z) - More Optimal Simulation of Universal Quantum Computers [0.0]
最悪のサンプリングコストは$le(2+sqrt2)xi_t delta-1$であり、$t rightarrow infty$である。
我々は、この68倍のプレファクタを、相関サンプリングにより$t$の先行値の低減により削減する。
論文 参考訳(メタデータ) (2022-02-02T19:00:03Z) - Active Sampling for Linear Regression Beyond the $\ell_2$ Norm [70.49273459706546]
対象ベクトルの少数のエントリのみを問合せすることを目的とした線形回帰のためのアクティブサンプリングアルゴリズムについて検討する。
我々はこの$d$への依存が対数的要因まで最適であることを示す。
また、損失関数に対して最初の全感度上界$O(dmax1,p/2log2 n)$を提供し、最大で$p$成長する。
論文 参考訳(メタデータ) (2021-11-09T00:20:01Z) - Consistent Estimation for PCA and Sparse Regression with Oblivious
Outliers [13.244654316770815]
我々は効率よく計算可能で一貫した推定器を設計する機械を開発する。
スパース回帰では、最適なサンプルサイズ$ngsim (klog d)/alpha2$の整合性を達成する。
PCAの文脈では、パラメータ行列上の広いスパイキネス仮定の下で最適な誤差を保証する。
論文 参考訳(メタデータ) (2021-11-04T15:59:44Z) - Spectral properties of sample covariance matrices arising from random
matrices with independent non identically distributed columns [50.053491972003656]
関数 $texttr(AR(z))$, for $R(z) = (frac1nXXT- zI_p)-1$ and $Ain mathcal M_p$ deterministic, have a standard deviation of order $O(|A|_* / sqrt n)$.
ここでは、$|mathbb E[R(z)] - tilde R(z)|_F を示す。
論文 参考訳(メタデータ) (2021-09-06T14:21:43Z) - An $\ell_p$ theory of PCA and spectral clustering [23.90245234027558]
主成分分析は統計と機械学習において強力なツールである。
本稿では、ヒルベルト空間におけるPCAの中空バージョンに対する$ell_p$理論を開発する。
文脈的コミュニティ検出のために、$ell_p$理論は、正確な回復のための情報しきい値を達成する単純なスペクトルアルゴリズムに導かれる。
論文 参考訳(メタデータ) (2020-06-24T21:30:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。