論文の概要: Robust Sub-Gaussian Principal Component Analysis and Width-Independent
Schatten Packing
- arxiv url: http://arxiv.org/abs/2006.06980v1
- Date: Fri, 12 Jun 2020 07:45:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 03:24:04.929739
- Title: Robust Sub-Gaussian Principal Component Analysis and Width-Independent
Schatten Packing
- Title(参考訳): ロバスト・サブガウス成分分析と幅非依存型シャッテン包装
- Authors: Arun Jambulapati, Jerry Li, Kevin Tian
- Abstract要約: 基本統計量に対する2つの方法を開発した:$epsilon$-corrupted set of $n$ sample from a $d$-linear sub-Gaussian distribution。
最初のロバストなアルゴリズムは反復フィルタリングを時間内に実行し、近似固有ベクトルを返し、単純なフィルタリングアプローチに基づいている。
私たちの2つめは、わずかに悪い近似係数を達成し、軽度のスペクトルギャップ仮定の下でほぼ自明な時間とイテレーションで実行します。
- 参考スコア(独自算出の注目度): 22.337756118270217
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop two methods for the following fundamental statistical task: given
an $\epsilon$-corrupted set of $n$ samples from a $d$-dimensional sub-Gaussian
distribution, return an approximate top eigenvector of the covariance matrix.
Our first robust PCA algorithm runs in polynomial time, returns a $1 -
O(\epsilon\log\epsilon^{-1})$-approximate top eigenvector, and is based on a
simple iterative filtering approach. Our second, which attains a slightly worse
approximation factor, runs in nearly-linear time and sample complexity under a
mild spectral gap assumption. These are the first polynomial-time algorithms
yielding non-trivial information about the covariance of a corrupted
sub-Gaussian distribution without requiring additional algebraic structure of
moments. As a key technical tool, we develop the first width-independent
solvers for Schatten-$p$ norm packing semidefinite programs, giving a $(1 +
\epsilon)$-approximate solution in
$O(p\log(\tfrac{nd}{\epsilon})\epsilon^{-1})$ input-sparsity time iterations
(where $n$, $d$ are problem dimensions).
- Abstract(参考訳): 我々は次の基本的な統計タスクのための2つの方法を開発した: $d$-dimensional sub-gaussian 分布から$\epsilon$-corupted のサンプル集合を与えられると、共分散行列の近似トップ固有ベクトルを返す。
最初のロバストPCAアルゴリズムは多項式時間で動作し、1O(\epsilon\log\epsilon^{-1})$-approximate top eigenvectorを返す。
近似係数がわずかに悪い第2項は、軽度のスペクトルギャップ仮定の下でほぼ直線時間とサンプルの複雑さで実行される。
これらは、モーメントのさらなる代数構造を必要とせず、崩壊したガウス分布の共分散に関する非自明な情報を生成する最初の多項式時間アルゴリズムである。
キーとなる技術ツールとして、Schatten-$p$ノルムパックのための最初の幅非依存の解法を開発し、$O(p\log(\tfrac{nd}{\epsilon})\epsilon^{-1})$入力スパーシティ時間反復(ここで$n$, $d$は問題次元)の$(1 + \epsilon)$-approximateソリューションを与える。
関連論文リスト
- Sum-of-squares lower bounds for Non-Gaussian Component Analysis [33.80749804695003]
非ガウス成分分析(Non-Gaussian Component Analysis、NGCA)は、高次元データセットにおいて非ガウス方向を求める統計的タスクである。
本稿では Sum-of-Squares フレームワークにおける NGCA の複雑さについて考察する。
論文 参考訳(メタデータ) (2024-10-28T18:19:13Z) - Efficient Statistics With Unknown Truncation, Polynomial Time Algorithms, Beyond Gaussians [7.04316974339151]
本研究では,サンプルが未知の集合に落下した場合にのみ,分布パラメータの推定を行う。
我々は,PAC学習から,正・負のサンプルによるPAC学習まで,独立したツールを開発する。
論文 参考訳(メタデータ) (2024-10-02T15:21:07Z) - Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs [56.237917407785545]
本稿では,円滑なベルマン作用素を持つ連続空間マルコフ決定過程(MDP)の一般クラスにおいて,$varepsilon$-optimal Policyを学習する問題を考察する。
我々のソリューションの鍵となるのは、調和解析のアイデアに基づく新しい射影技術である。
我々の結果は、連続空間 MDP における2つの人気と矛盾する視点のギャップを埋めるものである。
論文 参考訳(メタデータ) (2024-05-10T09:58:47Z) - Near-Optimal Algorithms for Gaussians with Huber Contamination: Mean
Estimation and Linear Regression [44.13655983242414]
最適誤差保証付きニア・ニア・ニア・リニア時間アルゴリズムの最初のサンプルを設計する。
堅牢な線形回帰のために、サンプル複雑性$n = tildeO(d/epsilon2)$と、ターゲット回帰器を$ell$-$O(epsilon)$で近似するほぼ線形ランタイムを持つ最初のアルゴリズムを与える。
これは、文献のオープンな疑問に答え、最適なエラー保証を達成するための最初のサンプルとタイムアルゴリズムである。
論文 参考訳(メタデータ) (2023-12-04T00:31:16Z) - Efficiently Learning One-Hidden-Layer ReLU Networks via Schur
Polynomials [50.90125395570797]
正方形損失に関して、標準的なガウス分布の下での$k$ReLU活性化の線形結合をPAC学習する問題をmathbbRd$で検討する。
本研究の主な成果は,この学習課題に対して,サンプルおよび計算複雑性が$(dk/epsilon)O(k)$で,epsilon>0$が目標精度である。
論文 参考訳(メタデータ) (2023-07-24T14:37:22Z) - Best Policy Identification in Linear MDPs [70.57916977441262]
縮退した線形マルコフ+デルタ決定における最適同定問題について, 生成モデルに基づく固定信頼度設定における検討を行った。
複雑な非最適化プログラムの解としての下位境界は、そのようなアルゴリズムを考案する出発点として用いられる。
論文 参考訳(メタデータ) (2022-08-11T04:12:50Z) - Leverage Score Sampling for Tensor Product Matrices in Input Sparsity
Time [54.65688986250061]
我々は,$q$-foldカラムワイドテンソル積の$q$行列に対応するグラム行列を近似するための入力空間時間サンプリングアルゴリズムを提案する。
我々のサンプリング技術は、合計時間でデータセット$X$に同時に適用できる$q$部分相関ランダムプロジェクションのコレクションに依存している。
論文 参考訳(メタデータ) (2022-02-09T15:26:03Z) - Clustering Mixture Models in Almost-Linear Time via List-Decodable Mean
Estimation [58.24280149662003]
本稿では,データセットの大部分を敵が破壊できるリストデコタブル平均推定の問題について検討する。
我々は、ほぼ最適な統計的保証を達成するために、リストデコダブル平均推定のための新しいアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-16T03:34:14Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。