論文の概要: Fast and Robust: Computationally Efficient Covariance Estimation for Sub-Weibull Vectors
- arxiv url: http://arxiv.org/abs/2512.17632v1
- Date: Fri, 19 Dec 2025 14:34:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.435042
- Title: Fast and Robust: Computationally Efficient Covariance Estimation for Sub-Weibull Vectors
- Title(参考訳): 高速かつロバスト:サブワイブルベクトルの計算効率の良い共分散推定
- Authors: Even He,
- Abstract要約: 本研究では,textbfSub-Weibull(拡張指数尾部$exp(-t)$)の特定の構造を目標とする。
要素的トランケーションとは異なり、我々の手法は、$O(Nd2)$演算を必要としながらスペクトル幾何学を保存する。
我々は、推定器が高い確率で最適な準ガウスレート$tildeO(sqrtr()/N)$を回復することを示す非漸近誤差境界を導出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-dimensional covariance estimation is notoriously sensitive to outliers. While statistically optimal estimators exist for general heavy-tailed distributions, they often rely on computationally expensive techniques like semidefinite programming or iterative M-estimation ($O(d^3)$). In this work, we target the specific regime of \textbf{Sub-Weibull distributions} (characterized by stretched exponential tails $\exp(-t^α)$). We investigate a computationally efficient alternative: the \textbf{Cross-Fitted Norm-Truncated Estimator}. Unlike element-wise truncation, our approach preserves the spectral geometry while requiring $O(Nd^2)$ operations, which represents the theoretical lower bound for constructing a full covariance matrix. Although spherical truncation is geometrically suboptimal for anisotropic data, we prove that within the Sub-Weibull class, the exponential tail decay compensates for this mismatch. Leveraging weighted Hanson-Wright inequalities, we derive non-asymptotic error bounds showing that our estimator recovers the optimal sub-Gaussian rate $\tilde{O}(\sqrt{r(Σ)/N})$ with high probability. This provides a scalable solution for high-dimensional data that exhibits tails heavier than Gaussian but lighter than polynomial decay.
- Abstract(参考訳): 高次元の共分散推定は、外れ値に敏感である。
一般の重み付き分布には統計的に最適な推定器が存在するが、半定値プログラミングや反復的M-推定(O(d^3)$)のような計算コストの高い手法に頼っていることが多い。
本研究は, 拡張指数尾部$\exp(-t^α)$ によって特徴づけられる \textbf{Sub-Weibull distributions} の特定の状態をターゲットにしている。
計算効率の良い代替案として, textbf{Cross-Fitted Norm-Truncated Estimator} について検討する。
要素的トランケーションとは異なり、我々の手法はスペクトル幾何学を保ちながら、完全な共分散行列を構成する理論的下界を表す$O(Nd^2)$演算を必要とする。
球面トルーンケーションは異方性データに対して幾何的に最適であるが、サブワイブル類では指数的尾崩壊がこのミスマッチを補うことを証明している。
重み付きハンソン・ライトの不等式を利用して、我々の推定器が高い確率で最適な準ガウス率 $\tilde{O}(\sqrt{r(Σ)/N})$ を回復することを示す非漸近誤差境界を導出する。
これにより、高次元データに対するスケーラブルな解が提供され、これはガウスよりも重いが多項式崩壊より軽いテールを示す。
関連論文リスト
- Nearly Optimal Robust Covariance and Scatter Matrix Estimation Beyond Gaussians [2.311583680973075]
楕円分布の共分散/散乱行列の計算効率の良いロバスト推定問題について検討する。
ガウスのケースを超えて拡張される、計算可能で、ほぼ最適な、ほぼ最適な共分散推定器を初めて得る。
論文 参考訳(メタデータ) (2025-02-10T15:31:57Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Semidefinite programming relaxations and debiasing for MAXCUT-based clustering [1.9761774213809036]
2つのガウス分布を$mathbbRp$で混合して引き出す小さなデータサンプルを$n$で分割する問題を考察する。
グラフ上の最大カットを求めるように定式化された整数二次プログラムの半定値プログラミング緩和を用いる。
論文 参考訳(メタデータ) (2024-01-16T03:14:24Z) - Efficient Estimation of the Central Mean Subspace via Smoothed Gradient Outer Products [12.047053875716506]
マルチインデックスモデルに対する十分な次元削減の問題を考察する。
高速パラメトリック収束速度が$C_d cdot n-1/2$であることを示す。
論文 参考訳(メタデータ) (2023-12-24T12:28:07Z) - Effective Minkowski Dimension of Deep Nonparametric Regression: Function
Approximation and Statistical Theories [70.90012822736988]
ディープ非パラメトリック回帰に関する既存の理論は、入力データが低次元多様体上にある場合、ディープニューラルネットワークは本質的なデータ構造に適応できることを示した。
本稿では,$mathcalS$で表される$mathbbRd$のサブセットに入力データが集中するという緩和された仮定を導入する。
論文 参考訳(メタデータ) (2023-06-26T17:13:31Z) - Nearly minimax robust estimator of the mean vector by iterative spectral
dimension reduction [5.414308305392762]
ガウス分布の平均ベクトルのロバストな推定問題について検討する。
スペクトル次元減少(SDR)に基づく推定器を導入し,その誤差に基づいて有限標本上限を確立する。
SDR推定器の分解点が、分解点の最大値である1/2$に等しいことを証明した。
論文 参考訳(メタデータ) (2022-04-05T16:29:09Z) - A Law of Robustness beyond Isoperimetry [84.33752026418045]
我々は、任意の分布上でニューラルネットワークパラメータを補間する頑健性の低い$Omega(sqrtn/p)$を証明した。
次に、$n=mathrmpoly(d)$のとき、スムーズなデータに対する過度なパラメータ化の利点を示す。
我々は、$n=exp(omega(d))$ のとき、$O(1)$-Lipschitz の頑健な補間関数の存在を否定する。
論文 参考訳(メタデータ) (2022-02-23T16:10:23Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z) - Linear Time Sinkhorn Divergences using Positive Features [51.50788603386766]
エントロピー正則化で最適な輸送を解くには、ベクトルに繰り返し適用される$ntimes n$ kernel matrixを計算する必要がある。
代わりに、$c(x,y)=-logdotpvarphi(x)varphi(y)$ ここで$varphi$は、地上空間から正のorthant $RRr_+$への写像であり、$rll n$である。
論文 参考訳(メタデータ) (2020-06-12T10:21:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。