論文の概要: Out-of-sample error estimate for robust M-estimators with convex penalty
- arxiv url: http://arxiv.org/abs/2008.11840v4
- Date: Thu, 3 Jun 2021 20:17:13 GMT
- Title: Out-of-sample error estimate for robust M-estimators with convex penalty
- Title(参考訳): 凸ペナルティを有するロバストM推定器のサンプル外誤差推定
- Authors: Pierre C Bellec
- Abstract要約: 凸ペナルティで正規化された堅牢な$M$-estimatorsに対して、一般的なサンプル外誤差推定を提案する。
一般的な微分可能損失関数 $psi$ は $psi=rho'$ が 1-Lipschitz であるときに許される。
- 参考スコア(独自算出の注目度): 5.33024001730262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A generic out-of-sample error estimate is proposed for robust $M$-estimators
regularized with a convex penalty in high-dimensional linear regression where
$(X,y)$ is observed and $p,n$ are of the same order. If $\psi$ is the
derivative of the robust data-fitting loss $\rho$, the estimate depends on the
observed data only through the quantities $\hat\psi = \psi(y-X\hat\beta)$,
$X^\top \hat\psi$ and the derivatives $(\partial/\partial y) \hat\psi$ and
$(\partial/\partial y) X\hat\beta$ for fixed $X$.
The out-of-sample error estimate enjoys a relative error of order $n^{-1/2}$
in a linear model with Gaussian covariates and independent noise, either
non-asymptotically when $p/n\le \gamma$ or asymptotically in the
high-dimensional asymptotic regime $p/n\to\gamma'\in(0,\infty)$. General
differentiable loss functions $\rho$ are allowed provided that $\psi=\rho'$ is
1-Lipschitz. The validity of the out-of-sample error estimate holds either
under a strong convexity assumption, or for the $\ell_1$-penalized Huber
M-estimator if the number of corrupted observations and sparsity of the true
$\beta$ are bounded from above by $s_*n$ for some small enough constant
$s_*\in(0,1)$ independent of $n,p$.
For the square loss and in the absence of corruption in the response, the
results additionally yield $n^{-1/2}$-consistent estimates of the noise
variance and of the generalization error. This generalizes, to arbitrary convex
penalty, estimates that were previously known for the Lasso.
- Abstract(参考訳): x,y)$ が観測され、p,n$ が同じ順序である高次元線形回帰において凸ペナルティで正則化された頑健な $m$-推定子に対して、一般的なサンプル外誤差推定が提案されている。
もし$\psi$ がロバストなデータフィッティング損失 $\rho$ の導関数であるなら、その推定は $\hat\psi = \psi(y-x\hat\beta)$, $x^\top \hat\psi$ と $(\partial/\partial y) \hat\psi$ と $(\partial/\partial y) x\hat\beta$ の固定値 $x$ によってのみ観測されたデータに依存する。
アウト・オブ・サンプル誤差推定は、ガウス共変量と独立ノイズを持つ線型モデルにおいて、$p/n\le \gamma$または高次元漸近状態において$p/n\to\gamma'\in(0,\infty)$の相対誤差を楽しむ。
一般的な微分可能損失関数 $\rho$ は $\psi=\rho'$ が 1-Lipschitz であるときに与えられる。
サンプル外誤差推定の妥当性は、強い凸性仮定の下で、または$\ell_1$-penalized Huber M-estimatorに対して、真の$\beta$の破損した観測数とスパーシリティが、ある小さな定数$s_*\in(0,1)$$$n,p$から独立して、上から$s_*n$に制限される。
正方形の損失と応答の腐敗がない場合、結果はさらに$n^{-1/2}$-consistent estimates of the noise variance and the generalization errorである。
