論文の概要: Poincaré Inequality for Local Log-Polyak-Lojasiewicz Measures : Non-asymptotic Analysis in Low-temperature Regime
- arxiv url: http://arxiv.org/abs/2502.06862v3
- Date: Sat, 15 Feb 2025 09:27:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 17:33:51.902400
- Title: Poincaré Inequality for Local Log-Polyak-Lojasiewicz Measures : Non-asymptotic Analysis in Low-temperature Regime
- Title(参考訳): 局所的ログ・ポリャック・ロジャシエヴィチ対策におけるポアンカレ不平等 : 低温レジームにおける非漸近解析
- Authors: Yun Gong, Zebang Shen, Niao He,
- Abstract要約: 深層学習のような関連する応用におけるポテンシャル関数は、非溶解性ミニマを許容する経験的に観察される。
我々はPL のクラスが $mu_epsilon propto exp(-V/epsilon) を測り、その局所ミニマの集合は証明可能 mph 接続であることを示す。
- 参考スコア(独自算出の注目度): 24.76306384187767
- License:
- Abstract: Potential functions in highly pertinent applications, such as deep learning in over-parameterized regime, are empirically observed to admit non-isolated minima. To understand the convergence behavior of stochastic dynamics in such landscapes, we propose to study the class of \logPLmeasure\ measures $\mu_\epsilon \propto \exp(-V/\epsilon)$, where the potential $V$ satisfies a local Polyak-{\L}ojasiewicz (P\L) inequality, and its set of local minima is provably \emph{connected}. Notably, potentials in this class can exhibit local maxima and we characterize its optimal set S to be a compact $\mathcal{C}^2$ \emph{embedding submanifold} of $\mathbb{R}^d$ without boundary. The \emph{non-contractibility} of S distinguishes our function class from the classical convex setting topologically. Moreover, the embedding structure induces a naturally defined Laplacian-Beltrami operator on S, and we show that its first non-trivial eigenvalue provides an \emph{$\epsilon$-independent} lower bound for the \Poincare\ constant in the \Poincare\ inequality of $\mu_\epsilon$. As a direct consequence, Langevin dynamics with such non-convex potential $V$ and diffusion coefficient $\epsilon$ converges to its equilibrium $\mu_\epsilon$ at a rate of $\tilde{\mathcal{O}}(1/\epsilon)$, provided $\epsilon$ is sufficiently small. Here $\tilde{\mathcal{O}}$ hides logarithmic terms.
- Abstract(参考訳): 過度にパラメータ化された状態における深層学習のような、関連する応用におけるポテンシャル関数は、非孤立化されたミニマを受け入れるために経験的に観察される。
そのような風景における確率力学の収束挙動を理解するために、測度 $\mu_\epsilon \propto \exp(-V/\epsilon)$ のクラスについて検討することを提案する。
特に、このクラスのポテンシャルは局所極大を示し、その最適集合 S を、境界のない$\mathbb{R}^d$のコンパクト $\mathcal{C}^2$ \emph{embedding submanifold} として特徴づける。
S の \emph{non-contractibility} は、位相的に古典凸集合と我々の函数類を区別する。
さらに、埋め込み構造は S 上の自然に定義されたラプラシアン・ベルトラミ作用素を誘導し、その最初の非自明な固有値が \emph{$\epsilon$-independent} の下界を \Poincare\ 定数の $\mu_\epsilon$ の不等式で提供することを示す。
- Efficient Continual Finite-Sum Minimization [52.5238287567572]
連続有限サム最小化(continuous finite-sum minimization)と呼ばれる有限サム最小化の鍵となるツイストを提案する。
我々のアプローチは$mathcalO(n/epsilon)$ FOs that $mathrmStochasticGradientDescent$で大幅に改善されます。
また、$mathcalOleft(n/epsilonalpharight)$ complexity gradient for $alpha 1/4$という自然な一階法は存在しないことを証明し、この方法の第一階法がほぼ密であることを示す。
論文 参考訳(メタデータ) (2024-06-07T08:26:31Z) - Estimating the Mixing Coefficients of Geometrically Ergodic Markov
Processes [5.00389879175348]
予想される誤差率は$mathcal O(log(n) n-1/2)$である。
論文 参考訳(メタデータ) (2024-02-11T20:17:10Z) - Learning linear dynamical systems under convex constraints [4.4351901934764975]
論文 参考訳(メタデータ) (2023-03-27T11:49:40Z) - A note on $L^1$-Convergence of the Empiric Minimizer for unbounded
functions with fast growth [0.0]
V : mathbbRd to mathbbR$ coercive に対して、経験的最小値の$L1$-distance の収束率について検討する。
一般に、高速な成長を持つ非有界函数に対しては、収束率は上述の$a_n n-1/q$で制限され、$q$は潜在確率変数の次元である。
論文 参考訳(メタデータ) (2023-03-08T08:46:13Z) - A Newton-CG based barrier-augmented Lagrangian method for general nonconvex conic optimization [53.044526424637866]
論文 参考訳(メタデータ) (2023-01-10T20:43:29Z) - Bound states of weakly deformed soft waveguides [0.0]
臨界場合 $int_mathbbR f,mathsfd x = 0$ では、十分小さな $varepsilon > 0$ に対して一意な有界状態が存在するという条件を導出する。
論文 参考訳(メタデータ) (2022-11-03T16:56:39Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - On quantitative Laplace-type convergence results for some exponential
probability measures, with two applications [2.9189409618561966]
密度 w.r.t ルベーグ測度 $(mathrmd pi_varepsilon)_varepsilon >0$ ルベーグ測度 $(mathrmd pi_varepsilon)_varepsilon >0$ ルベーグ測度 $(mathrmd pi_varepsilon)_varepsilon >0$ ルベーグ測度 $(mathrmd pi_varepsilon)_varepsilon >0$ ルベーグ測度 $(mathrmd)
論文 参考訳(メタデータ) (2021-10-25T13:00:25Z) - Faster Perturbed Stochastic Gradient Methods for Finding Local Minima [92.99933928528797]
SARAH/SP や STORM のような勾配推定器を用いたプルバックは $(epsilon, epsilon_H)$approximate local minima を $tilde O(epsilon-3 + H-6)$ 内で見つけることができる。
論文 参考訳(メタデータ) (2021-10-25T07:20:05Z) - Agnostic Learning of a Single Neuron with Gradient Descent [92.7662890047311]
論文 参考訳(メタデータ) (2020-05-29T07:20:35Z) - On the Complexity of Minimizing Convex Finite Sums Without Using the
Indices of the Individual Functions [62.01594253618911]
同様のアプローチを踏襲したSVRGの新規な適応法を提案し、これはオラクルと互換性があり、$tildeO(n2+nsqrtL/mu)log (1/epsilon)$と$O(nsqrtL/epsilon)$, for $mu>0$と$mu=0$の複雑さ境界を実現する。
論文 参考訳(メタデータ) (2020-02-09T03:39:46Z)