論文の概要: Support Recovery in Sparse PCA with Non-Random Missing Data
- arxiv url: http://arxiv.org/abs/2302.01535v1
- Date: Fri, 3 Feb 2023 04:20:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-06 17:33:15.140537
- Title: Support Recovery in Sparse PCA with Non-Random Missing Data
- Title(参考訳): 非ランダム欠落データを用いたスパースPCAの回復支援
- Authors: Hanbyul Lee, Qifan Song, Jean Honorio
- Abstract要約: 非ランダムサンプリング方式の下で,不完全かつノイズの多いデータに基づいてスパースPCAの実用的なアルゴリズムを解析する。
理論的には、ある条件下では、スパースリード固有ベクトルの支持を高い確率で回復することができる。
提案アルゴリズムは, 観察された成分が良好な構造特性を持つ場合, その他のスパースPCA手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 27.3669650952144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We analyze a practical algorithm for sparse PCA on incomplete and noisy data
under a general non-random sampling scheme. The algorithm is based on a
semidefinite relaxation of the $\ell_1$-regularized PCA problem. We provide
theoretical justification that under certain conditions, we can recover the
support of the sparse leading eigenvector with high probability by obtaining a
unique solution. The conditions involve the spectral gap between the largest
and second-largest eigenvalues of the true data matrix, the magnitude of the
noise, and the structural properties of the observed entries. The concepts of
algebraic connectivity and irregularity are used to describe the structural
properties of the observed entries. We empirically justify our theorem with
synthetic and real data analysis. We also show that our algorithm outperforms
several other sparse PCA approaches especially when the observed entries have
good structural properties. As a by-product of our analysis, we provide two
theorems to handle a deterministic sampling scheme, which can be applied to
other matrix-related problems.
- Abstract(参考訳): 非ランダムサンプリング方式で不完全・雑音データに対するスパースpcaの実用的アルゴリズムを解析した。
このアルゴリズムは、$\ell_1$-regularized PCA問題の半定緩和に基づいている。
理論上は、ある条件下では、特異解を得ることにより、高い確率でスパースリード固有ベクトルの支持を回復できる。
この条件は、真のデータ行列の最大値と2番目に大きい固有値の間のスペクトルギャップ、ノイズの大きさ、観察された成分の構造的特性を含む。
代数接続の概念と不規則性は、観察された成分の構造的性質を記述するために用いられる。
我々は、我々の定理を合成および実データ分析で実証的に正当化する。
また,本アルゴリズムは,観察された成分が良好な構造特性を持つ場合,他のスパースPCA手法よりも優れていることを示す。
解析の副産物として,行列関連問題に適用可能な決定論的サンプリングスキームを扱うための2つの定理を提案する。
関連論文リスト
- Sparse PCA with Oracle Property [115.72363972222622]
新規な正規化を伴うスパースPCAの半定緩和に基づく推定器群を提案する。
我々は、家族内の別の推定器が、スパースPCAの標準半定緩和よりも、より急激な収束率を達成することを証明した。
論文 参考訳(メタデータ) (2023-12-28T02:52:54Z) - Bayes-optimal limits in structured PCA, and how to reach them [21.3083877172595]
本研究では,主成分分析(PCA)のパラダイム行列モデルについて検討し,次数1の行列が付加雑音によって劣化することを示した。
このモデルにおいて、ベイズ-最適推論の極限を初めて特徴づける。
本稿では、適応的Thouless-Anderson-Palmer方程式の理論に着想を得た、新しい近似メッセージパッシングアルゴリズム(AMP)を提案する。
論文 参考訳(メタデータ) (2022-10-03T21:31:41Z) - Exploring the Algorithm-Dependent Generalization of AUPRC Optimization
with List Stability [107.65337427333064]
AUPRC(Area Under the Precision-Recall Curve)の最適化は、機械学習にとって重要な問題である。
本研究では, AUPRC最適化の単依存一般化における最初の試行について述べる。
3つの画像検索データセットの実験は、我々のフレームワークの有効性と健全性に言及する。
論文 参考訳(メタデータ) (2022-09-27T09:06:37Z) - Support Recovery in Sparse PCA with Incomplete Data [27.3669650952144]
主成分分析(PCA)不完全データに対する実用的アルゴリズムを用いる。
未知の真のSDPが不完全支持行列を正確に復元できるという理論的および実験的証拠を提供する。
不完全データを用いて理論結果を検証し、分散表現において有意義な結果を示す。
論文 参考訳(メタデータ) (2022-05-30T16:17:39Z) - Reinforcement Learning from Partial Observation: Linear Function Approximation with Provable Sample Efficiency [111.83670279016599]
部分観察決定過程(POMDP)の無限観測および状態空間を用いた強化学習について検討した。
線形構造をもつPOMDPのクラスに対する部分可観測性と関数近似の最初の試みを行う。
論文 参考訳(メタデータ) (2022-04-20T21:15:38Z) - Partial Counterfactual Identification from Observational and
Experimental Data [83.798237968683]
観測データと実験データの任意の組み合わせから最適境界を近似する有効なモンテカルロアルゴリズムを開発した。
我々のアルゴリズムは、合成および実世界のデータセットに基づいて広範囲に検証されている。
論文 参考訳(メタデータ) (2021-10-12T02:21:30Z) - Robust Principal Component Analysis: A Median of Means Approach [17.446104539598895]
主成分分析(main Component Analysis)は、データビジュアライゼーション、デノイング、次元削減のためのツールである。
最近の教師付き学習手法は、外見的な観察を扱う上で大きな成功を収めている。
本稿では,MoM原理に基づくPCA手法を提案する。
論文 参考訳(メタデータ) (2021-02-05T19:59:05Z) - A Linearly Convergent Algorithm for Distributed Principal Component
Analysis [12.91948651812873]
本稿では,1時間スケール分散pcaアルゴリズムである分散sanger's algorithm(dsa)を提案する。
提案アルゴリズムは真の解の近傍に線形収束することを示した。
論文 参考訳(メタデータ) (2021-01-05T00:51:14Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Exact and Approximation Algorithms for Sparse PCA [1.7640556247739623]
本稿では,MISDP(MISDP)とMISDP(MISDP)について述べる。
次に、それらの連続緩和値の理論的最適性ギャップを分析し、それらが最先端の値よりも強いことを証明する。
市販の解法は一般にMISDPを解くのが難しいため,MISDPと同等の大きさのMILP(mixed-integer linear program)を用いてSPCAを任意の精度で近似する。
論文 参考訳(メタデータ) (2020-08-28T02:07:08Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。