論文の概要: Nearly minimax robust estimator of the mean vector by iterative spectral
dimension reduction
- arxiv url: http://arxiv.org/abs/2204.02323v1
- Date: Tue, 5 Apr 2022 16:29:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 14:59:11.515942
- Title: Nearly minimax robust estimator of the mean vector by iterative spectral
dimension reduction
- Title(参考訳): 反復スペクトル次元減少法による平均ベクトルの極小ロバスト推定器
- Authors: Amir-Hossein Bateni, Arshak Minasyan, Arnak S. Dalalyan
- Abstract要約: ガウス分布の平均ベクトルのロバストな推定問題について検討する。
スペクトル次元減少(SDR)に基づく推定器を導入し,その誤差に基づいて有限標本上限を確立する。
SDR推定器の分解点が、分解点の最大値である1/2$に等しいことを証明した。
- 参考スコア(独自算出の注目度): 5.414308305392762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of robust estimation of the mean vector of a
sub-Gaussian distribution. We introduce an estimator based on spectral
dimension reduction (SDR) and establish a finite sample upper bound on its
error that is minimax-optimal up to a logarithmic factor. Furthermore, we prove
that the breakdown point of the SDR estimator is equal to $1/2$, the highest
possible value of the breakdown point. In addition, the SDR estimator is
equivariant by similarity transforms and has low computational complexity. More
precisely, in the case of $n$ vectors of dimension $p$ -- at most $\varepsilon
n$ out of which are adversarially corrupted -- the SDR estimator has a squared
error of order $\big(\frac{r_\Sigma}{n} +
\varepsilon^2\log(1/\varepsilon)\big){\log p}$ and a running time of order $p^3
+ n p^2$. Here, $r_\Sigma\le p$ is the effective rank of the covariance matrix
of the reference distribution. Another advantage of the SDR estimator is that
it does not require knowledge of the contamination rate and does not involve
sample splitting. We also investigate extensions of the proposed algorithm and
of the obtained results in the case of (partially) unknown covariance matrix.
- Abstract(参考訳): サブガウス分布の平均ベクトルのロバスト推定の問題点について検討する。
スペクトル次元減少(SDR)に基づく推定器を導入し,その誤差に基づいて,対数係数までの最小最適値である有限標本上限を確立する。
さらに、SDR推定器の分解点が、分解点の最大値である1/2$に等しいことを証明した。
さらに、SDR推定器は類似性変換により不変であり、計算複雑性が低い。
より正確には、次元 $p$ の $n$ ベクトルの場合 -- 最大$\varepsilon n$ の内、少なくとも$\varepsilon n$ は逆腐敗している -- SDR 推定器は位数 $\big(\frac{r_\Sigma}{n} + \varepsilon^2\log(1/\varepsilon)\big){\log p}$ と位数 $p^3 + n p^2$ のランニング時間を持つ。
ここで、$r_\Sigma\le p$ は基準分布の共分散行列の有効ランクである。
SDR推定器のもう1つの利点は、汚染率の知識を必要とせず、サンプル分割を伴わないことである。
また、提案アルゴリズムの拡張と、(部分的に)未知の共分散行列の場合の結果についても検討する。
関連論文リスト
- Dimension-free Private Mean Estimation for Anisotropic Distributions [55.86374912608193]
以前の$mathRd上の分布に関する民間推定者は、次元性の呪いに苦しむ。
本稿では,サンプルの複雑さが次元依存性を改善したアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-01T17:59:53Z) - Obtaining Lower Query Complexities through Lightweight Zeroth-Order Proximal Gradient Algorithms [65.42376001308064]
複素勾配問題に対する2つの分散化ZO推定器を提案する。
我々は、現在最先端の機能複雑性を$mathcalOleft(minfracdn1/2epsilon2, fracdepsilon3right)$から$tildecalOleft(fracdepsilon2right)$に改善する。
論文 参考訳(メタデータ) (2024-10-03T15:04:01Z) - Near-Optimal differentially private low-rank trace regression with guaranteed private initialization [0.0]
RRd_1times d$におけるランク-r$行列$Mの差分プライベート(DP)推定をトレース回帰モデルの下で検討する。
我々はまた、リーマン最適化(DP-RGrad)に基づいて$M$を推定する微分プライベートアルゴリズムを提案する。
DP-RGradで与えられる推定器は、微分プライバシーというより弱い概念において最適収束率に達することが示されている。
論文 参考訳(メタデータ) (2024-03-24T03:57:21Z) - Estimation of entropy-regularized optimal transport maps between
non-compactly supported measures [15.857723276537248]
本稿では,ガウシアン以下の音源と目標測度の間の2乗ユークリッドコストでエントロピー規則化された最適輸送マップを推定する問題に対処する。
論文 参考訳(メタデータ) (2023-11-20T17:18:21Z) - Robust Sparse Mean Estimation via Sum of Squares [42.526664955704746]
本研究では,高次元スパース平均推定の問題点を,逆数外乱の$epsilon$-fractionの存在下で検討する。
我々のアルゴリズムは、サム・オブ・スクエア(Sum-of-Squares)ベースのアルゴリズムアプローチに従う。
論文 参考訳(メタデータ) (2022-06-07T16:49:54Z) - Consistent Estimation for PCA and Sparse Regression with Oblivious
Outliers [13.244654316770815]
我々は効率よく計算可能で一貫した推定器を設計する機械を開発する。
スパース回帰では、最適なサンプルサイズ$ngsim (klog d)/alpha2$の整合性を達成する。
PCAの文脈では、パラメータ行列上の広いスパイキネス仮定の下で最適な誤差を保証する。
論文 参考訳(メタデータ) (2021-11-04T15:59:44Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - Lattice partition recovery with dyadic CART [79.96359947166592]
我々は、$d$次元格子上の加法ガウス雑音によって破損したピースワイド定値信号について検討する。
この形式のデータは、多くのアプリケーションで自然に発生し、統計処理や信号処理の文献において、信号の検出やテスト、ノイズの除去、推定といったタスクが広く研究されている。
本稿では,未知の信号の一貫性領域によって誘導される格子の分割を推定する,分割回復の問題について考察する。
我々は、DCARTベースの手順が、下位分割を$sigma2 k*の順序で一貫して推定することを証明した。
論文 参考訳(メタデータ) (2021-05-27T23:41:01Z) - The Sample Complexity of Robust Covariance Testing [56.98280399449707]
i. i. d.
形式 $Z = (1-epsilon) X + epsilon B$ の分布からのサンプル。ここで $X$ はゼロ平均で未知の共分散である Gaussian $mathcalN(0, Sigma)$ である。
汚染がない場合、事前の研究は、$O(d)$サンプルを使用するこの仮説テストタスクの単純なテスターを与えた。
サンプル複雑性の上限が $omega(d2)$ for $epsilon$ an arbitrarily small constant and $gamma であることを証明します。
論文 参考訳(メタデータ) (2020-12-31T18:24:41Z) - Optimal Sub-Gaussian Mean Estimation in $\mathbb{R}$ [5.457150493905064]
ガウス下収束を考慮した新しい推定器を提案する。
我々の推定器はその分散に関する事前の知識を必要としない。
我々の推定器の構成と分析は、他の問題に一般化可能なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-11-17T02:47:24Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。