論文の概要: Sparse PCA with Oracle Property
- arxiv url: http://arxiv.org/abs/2312.16793v1
- Date: Thu, 28 Dec 2023 02:52:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 17:45:10.246223
- Title: Sparse PCA with Oracle Property
- Title(参考訳): OracleプロパティによるスパースPCA
- Authors: Quanquan Gu and Zhaoran Wang and Han Liu
- Abstract要約: 新規な正規化を伴うスパースPCAの半定緩和に基づく推定器群を提案する。
我々は、家族内の別の推定器が、スパースPCAの標準半定緩和よりも、より急激な収束率を達成することを証明した。
- 参考スコア(独自算出の注目度): 115.72363972222622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the estimation of the $k$-dimensional sparse
principal subspace of covariance matrix $\Sigma$ in the high-dimensional
setting. We aim to recover the oracle principal subspace solution, i.e., the
principal subspace estimator obtained assuming the true support is known a
priori. To this end, we propose a family of estimators based on the
semidefinite relaxation of sparse PCA with novel regularizations. In
particular, under a weak assumption on the magnitude of the population
projection matrix, one estimator within this family exactly recovers the true
support with high probability, has exact rank-$k$, and attains a $\sqrt{s/n}$
statistical rate of convergence with $s$ being the subspace sparsity level and
$n$ the sample size. Compared to existing support recovery results for sparse
PCA, our approach does not hinge on the spiked covariance model or the limited
correlation condition. As a complement to the first estimator that enjoys the
oracle property, we prove that, another estimator within the family achieves a
sharper statistical rate of convergence than the standard semidefinite
relaxation of sparse PCA, even when the previous assumption on the magnitude of
the projection matrix is violated. We validate the theoretical results by
numerical experiments on synthetic datasets.
- Abstract(参考訳): 本稿では,高次元環境における共分散行列 $\sigma$ の 1 次元スパース主部分空間の推定について検討する。
私たちはoracleのprincipal subspaceソリューション、すなわち、真のサポートが事前に知られていると仮定して得られたprincipal subspace estimatorを回復することを目指している。
そこで本研究では,新しい正則化を伴うスパースpcaの半定値緩和に基づく推定器群を提案する。
特に、人口予想行列の大きさに関する弱い仮定の下で、この族内の1つの推定子は、高い確率で真の支持を正確に回復し、正確なランク-$k$を持ち、$\sqrt{s/n}$の収束の統計速度を、$s$は部分空間空間空間レベル、$n$のサンプルサイズに達する。
スパースPCAの既存サポート回復結果と比較して,本手法はスパイク共分散モデルや限定相関条件には適用されない。
オラクル特性を楽しむ最初の推定器の補足として、行列の大きさに関する以前の仮定が破られたとしても、家族内の別の推定器はスパースPCAの標準半定緩和よりもはるかに統計的収束率が高いことを証明した。
合成データセットの数値実験により理論的結果を検証する。
関連論文リスト
- Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Black-Box $k$-to-$1$-PCA Reductions: Theory and Applications [19.714951004096996]
ブラックボックスデフレ法を$k$-PCAアルゴリズムを設計するためのフレームワークとして分析する。
我々の主な貢献は、$k$-PCAのデフレ法における近似パラメータの劣化に対する、よりシャープな境界である。
我々は,最先端の$k$-PCAアルゴリズムをデータセット汚染に頑健にするために,我々のフレームワークを適用した。
論文 参考訳(メタデータ) (2024-03-06T18:07:20Z) - Entrywise Recovery Guarantees for Sparse PCA via Sparsistent Algorithms [9.112172220055431]
一般的な高次元のガウス設計の下で、スパースPCAに対して入出力$ell_2,infty$boundsを提供する。
提案手法は,確率の高い正しいサポートを選択するアルゴリズムであり,スパーシスタントなアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-08T18:50:35Z) - Support Recovery with Stochastic Gates: Theory and Application for
Linear Models [9.644417971611908]
本研究では,独立かつ同一に分布する正規誤差を持つ線形モデルにおいて,係数ベクトル(beta*$)の同時回復と推定の問題を解析する。
設計を考えると、$beta*$ $beta*$の適切な条件下では、STGベースの推定器は真のデータ生成係数ベクトルに収束し、その支持セットを高い確率で検出する。
論文 参考訳(メタデータ) (2021-10-29T17:59:43Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - $\gamma$-ABC: Outlier-Robust Approximate Bayesian Computation Based on a
Robust Divergence Estimator [95.71091446753414]
最寄りの$gamma$-divergence推定器をデータ差分尺度として用いることを提案する。
本手法は既存の不一致対策よりも高いロバスト性を実現する。
論文 参考訳(メタデータ) (2020-06-13T06:09:27Z) - Low-Rank Matrix Estimation From Rank-One Projections by Unlifted Convex
Optimization [9.492903649862761]
階数1の投影から低階行列を復元するための定式化凸を用いた推定器について検討した。
両モデルにおいて、測定値が$r2 (d+d_$2)以上の場合、推定器は高い確率で成功することを示す。
論文 参考訳(メタデータ) (2020-04-06T14:57:54Z) - Distributed Estimation for Principal Component Analysis: an Enlarged
Eigenspace Analysis [45.829683377074524]
本稿では,基本統計的機械学習問題,主成分分析(PCA)の分散推定について検討する。
本稿では,分散データのためのトップ$L$-dim固有空間を構築するための新しいマルチラウンドアルゴリズムを提案する。
我々のアルゴリズムは、シフト・アンド・インバート・プレコンディショニングと凸最適化を利用する。
論文 参考訳(メタデータ) (2020-04-05T22:28:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。