論文の概要: Bless and curse of smoothness and phase transitions in nonparametric
regressions: a nonasymptotic perspective
- arxiv url: http://arxiv.org/abs/2112.03626v1
- Date: Tue, 7 Dec 2021 10:55:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 15:57:04.737212
- Title: Bless and curse of smoothness and phase transitions in nonparametric
regressions: a nonasymptotic perspective
- Title(参考訳): 非パラメトリック回帰における滑らかさと相転移の祝福と呪い:非漸近的視点
- Authors: Ying Zhu
- Abstract要約: 平均二乗誤差における最小収束速度は、$gamma$が有限であるとき、$left(fracsigma2nright)frac2gamma+22gamma+3$であることを示す。
H'older クラスと Sobolev クラスの場合、最小値の最適値は $fracsigma2left(gammavee1right)n$ if $fracnsigma2succsimleft(gammavee1right) である。
- 参考スコア(独自算出の注目度): 2.132096006921048
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When the regression function belongs to the standard smooth classes
consisting of univariate functions with derivatives up to the $(\gamma+1)$th
order bounded by a common constant everywhere or a.e., it is well known that
the minimax optimal rate of convergence in mean squared error (MSE) is
$\left(\frac{\sigma^{2}}{n}\right)^{\frac{2\gamma+2}{2\gamma+3}}$ when $\gamma$
is finite and the sample size $n\rightarrow\infty$. From a nonasymptotic
viewpoint that considers finite $n$, this paper shows that: for the standard
H\"older and Sobolev classes, the minimax optimal rate is
$\frac{\sigma^{2}\left(\gamma\vee1\right)}{n}$ when
$\frac{n}{\sigma^{2}}\precsim\left(\gamma\vee1\right)^{2\gamma+3}$ and
$\left(\frac{\sigma^{2}}{n}\right)^{\frac{2\gamma+2}{2\gamma+3}}$ when
$\frac{n}{\sigma^{2}}\succsim\left(\gamma\vee1\right)^{2\gamma+3}$. To
establish these results, we derive upper and lower bounds on the covering and
packing numbers for the generalized H\"older class where the $k$th
($k=0,...,\gamma$) derivative is bounded from above by a parameter $R_{k}$ and
the $\gamma$th derivative is $R_{\gamma+1}-$Lipschitz (and also for the
generalized ellipsoid class of smooth functions). Our bounds sharpen the
classical metric entropy results for the standard classes, and give the general
dependence on $\gamma$ and $R_{k}$. By deriving the minimax optimal MSE rates
under $R_{k}=1$, $R_{k}\leq\left(k-1\right)!$ and $R_{k}=k!$ (with the latter
two cases motivated in our introduction) with the help of our new entropy
bounds, we show a couple of interesting results that cannot be shown with the
existing entropy bounds in the literature. For the H\"older class of
$d-$variate functions, our result suggests that the classical asymptotic rate
$\left(\frac{\sigma^{2}}{n}\right)^{\frac{2\gamma+2}{2\gamma+2+d}}$ could be an
underestimate of the MSE in finite samples.
- Abstract(参考訳): 回帰関数が、至る所で共通定数で有界な$(\gamma+1)$thの微分を持つ単変数函数からなる標準滑らか類に属するとき、平均二乗誤差(MSE)における収束の最小値が$\left(\frac{\sigma^{2}}{n}\right)^{\frac{2\gamma+2}{2\gamma+3}}$で、$\gamma$が有限でサンプルサイズが$n\rightarrow\infty$であることが知られている。
標準 h\"older と sobolev のクラスについて、minimax の最適レートは $\frac{\sigma^{2}\left(\gamma\vee1\right)}{n}$ when $\frac{n}{\sigma^{2}}\precsim\left(\gamma\vee1\right)^{2\gamma+3}$ and $\left(\frac{\sigma^{2}}{n}\right)^{\frac{2\gamma+2}{2\gamma+3}}$ when $\frac{n}{\sigma^{2}}\succsim\left(\gamma\vee1\right)^{2\gamma+3}$である。
これらの結果を確立するために、一般化されたH\"古いクラスに対する被覆と梱包数の上と下の境界を導出する:$k$th$k=0, ...,\gamma$) 微分は上から$R_{k}$で有界であり、$\gamma$th 微分は$R_{\gamma+1}-$Lipschitzである(また、滑らかな函数の一般化楕円型クラスについても)。
我々の境界は、標準クラスに対する古典的計量エントロピー結果を鋭くし、$\gamma$ および $R_{k}$ への一般依存を与える。
R_{k}=1$, $R_{k}\leq\left(k-1\right)!
と$R_{k}=k!
新しいエントロピー境界(entropy bounds)の助けを借りて、$(後者の2つのケースは導入時に動機付けられたものです)は、既存のエントロピー境界(entropy bounds)で表示できない興味深い結果をいくつか示しています。
より古い$d-$variate函数のクラスについては、古典的漸近率 $\left(\frac{\sigma^{2}}{n}\right)^{\frac{2\gamma+2}{2\gamma+2+d}}$ が有限標本における MSE の過小評価である可能性が示唆されている。
関連論文リスト
- Stable Minima Cannot Overfit in Univariate ReLU Networks: Generalization by Large Step Sizes [29.466981306355066]
固定学習率$eta$の勾配降下はスムーズな関数を表す局所最小値しか見つからないことを示す。
また、$n$のデータポイントのサポートの厳密な内部で、$widetildeO(n-4/5)$のほぼ最適MSE境界を証明します。
論文 参考訳(メタデータ) (2024-06-10T22:57:27Z) - On the $O(\frac{\sqrt{d}}{T^{1/4}})$ Convergence Rate of RMSProp and Its Momentum Extension Measured by $\ell_1$ Norm [59.65871549878937]
本稿では、RMSPropとその運動量拡張を考察し、$frac1Tsum_k=1Tの収束速度を確立する。
我々の収束率は、次元$d$を除くすべての係数に関して下界と一致する。
収束率は$frac1Tsum_k=1Tと類似していると考えられる。
論文 参考訳(メタデータ) (2024-02-01T07:21:32Z) - Sharper Convergence Guarantees for Asynchronous SGD for Distributed and
Federated Learning [77.22019100456595]
通信周波数の異なる分散計算作業者のトレーニングアルゴリズムを示す。
本研究では,より厳密な収束率を$mathcalO!!(sigma2-2_avg!)とする。
また,不均一性の項は,作業者の平均遅延によっても影響されることを示した。
論文 参考訳(メタデータ) (2022-06-16T17:10:57Z) - Sharper Rates for Separable Minimax and Finite Sum Optimization via
Primal-Dual Extragradient Methods [39.87865197769047]
分離可能なミニマックス最適化問題 $min_x max_y f(x) - g(y) + h(x, y)$, where $f$ and $g$ have smoothness and strong convexity parameters $(Lx, mux)$, $(Ly, muy)$, and $h$ is convex-concave with a $(Lambdaxx, Lambdaxy, Lambdayymuyright)$。
論文 参考訳(メタデータ) (2022-02-09T18:57:47Z) - Accelerated Gradient Tracking over Time-varying Graphs for Decentralized Optimization [59.65871549878937]
実用的な単一ループ加速勾配追跡には$O(fracgamma1-sigma_gamma)2sqrtfracLepsilon)$が必要であることを証明している。
我々の収束率は$O(frac1epsilon5/7)$と$O(fracLmu)5/7frac1(1-sigma)1.5logfrac1epsilon)$よりも大幅に改善した。
論文 参考訳(メタデータ) (2021-04-06T15:34:14Z) - Infinite-Horizon Offline Reinforcement Learning with Linear Function
Approximation: Curse of Dimensionality and Algorithm [46.36534144138337]
本稿では,オフライン強化学習におけるポリシー評価のサンプル複雑さについて検討する。
低分布シフトの仮定の下では、最大$oleft(maxleft fracleftvert thetapirightvert _24varepsilon4logfracddelta,frac1varepsilon2left(d+logfrac1deltaright)right right)$サンプルを必要とするアルゴリズムがあることを示す。
論文 参考訳(メタデータ) (2021-03-17T18:18:57Z) - Private Stochastic Convex Optimization: Optimal Rates in $\ell_1$
Geometry [69.24618367447101]
対数要因まで $(varepsilon,delta)$-differently private の最適過剰人口損失は $sqrtlog(d)/n + sqrtd/varepsilon n.$ です。
損失関数がさらなる滑らかさの仮定を満たすとき、余剰損失は$sqrtlog(d)/n + (log(d)/varepsilon n)2/3で上界(対数因子まで)であることが示される。
論文 参考訳(メタデータ) (2021-03-02T06:53:44Z) - Revisiting EXTRA for Smooth Distributed Optimization [70.65867695317633]
改良された$Oleft(left(fracLmu+frac11-sigma_2(W)right)logfrac1epsilon (1-sigma_2(W))right)$。
高速化されたEXTRAの通信複雑性は、$left(logfracLmu (1-sigma_2(W))right)$と$left(logfrac1epsilon (1。
論文 参考訳(メタデータ) (2020-02-24T08:07:08Z) - Near-Optimal Methods for Minimizing Star-Convex Functions and Beyond [25.845034951660544]
我々は,一階述語法では改善できないことを示した。
我々は、$$quasar のアログ関数を計算する変種加速降下を開発する。
ファーストオーダーの方法では改善できません。
論文 参考訳(メタデータ) (2019-06-27T22:39:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。