論文の概要: Iterative thresholding for non-linear learning in the strong $\varepsilon$-contamination model
- arxiv url: http://arxiv.org/abs/2409.03703v1
- Date: Thu, 5 Sep 2024 16:59:56 GMT
- Title: Iterative thresholding for non-linear learning in the strong $\varepsilon$-contamination model
- Title(参考訳): 強い$\varepsilon$-contaminationモデルにおける非線形学習の反復しきい値付け
- Authors: Arvind Rathnashyam, Alex Gittens,
- Abstract要約: 閾値降下を用いた単一ニューロンモデル学習のための近似境界を導出する。
線形回帰問題も研究し、$sigma(mathbfx) = mathbfx$ となる。
- 参考スコア(独自算出の注目度): 3.309767076331365
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We derive approximation bounds for learning single neuron models using thresholded gradient descent when both the labels and the covariates are possibly corrupted adversarially. We assume the data follows the model $y = \sigma(\mathbf{w}^{*} \cdot \mathbf{x}) + \xi,$ where $\sigma$ is a nonlinear activation function, the noise $\xi$ is Gaussian, and the covariate vector $\mathbf{x}$ is sampled from a sub-Gaussian distribution. We study sigmoidal, leaky-ReLU, and ReLU activation functions and derive a $O(\nu\sqrt{\epsilon\log(1/\epsilon)})$ approximation bound in $\ell_{2}$-norm, with sample complexity $O(d/\epsilon)$ and failure probability $e^{-\Omega(d)}$. We also study the linear regression problem, where $\sigma(\mathbf{x}) = \mathbf{x}$. We derive a $O(\nu\epsilon\log(1/\epsilon))$ approximation bound, improving upon the previous $O(\nu)$ approximation bounds for the gradient-descent based iterative thresholding algorithms of Bhatia et al. (NeurIPS 2015) and Shen and Sanghavi (ICML 2019). Our algorithm has a $O(\textrm{polylog}(N,d)\log(R/\epsilon))$ runtime complexity when $\|\mathbf{w}^{*}\|_2 \leq R$, improving upon the $O(\text{polylog}(N,d)/\epsilon^2)$ runtime complexity of Awasthi et al. (NeurIPS 2022).
- Abstract(参考訳): ラベルと共変量の両方が逆向きに劣化している場合,閾値勾配勾配を用いた単一ニューロンモデル学習のための近似バウンダリを導出する。
モデル $y = \sigma(\mathbf{w}^{*} \cdot \mathbf{x}) + \xi,$ ここで、$\sigma$ は非線形活性化関数であり、ノイズ $\xi$ はガウスであり、共変ベクトル $\mathbf{x}$ はガウス分布からサンプリングされる。
我々はSigmoidal, leaky-ReLU, ReLU 活性化関数を研究し、$O(\nu\sqrt{\epsilon\log(1/\epsilon)})$ approximation bound in $\ell_{2}$-norm, with sample complexity $O(d/\epsilon)$ and failure probability $e^{-\Omega(d)}$を導出する。
線形回帰問題も研究し、$\sigma(\mathbf{x}) = \mathbf{x}$ となる。
我々は、Bhatia et al (NeurIPS 2015) と Shen and Sanghavi (ICML 2019) の勾配差に基づく反復しきい値アルゴリズムに対して、以前の$O(\nu)$近似境界を改善した$O(\nu\epsilon\log(1/\epsilon))$近似境界を導出した。
我々のアルゴリズムは、$O(\text{polylog}(N,d)\log(R/\epsilon))$ Runtime complexity when $\|\mathbf{w}^{*}\|_2 \leq R$, improve on the $O(\text{polylog}(N,d)/\epsilon^2)$ Runtime complexity of Awasthi et al (NeurIPS 2022)である。
