論文の概要: A Tale of Two Geometries: Adaptive Optimizers and Non-Euclidean Descent
- arxiv url: http://arxiv.org/abs/2511.20584v1
- Date: Tue, 25 Nov 2025 18:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.602782
- Title: A Tale of Two Geometries: Adaptive Optimizers and Non-Euclidean Descent
- Title(参考訳): 2つのジオメトリの物語:適応的最適化と非ユークリッドの輝き
- Authors: Shuo Xie, Tianhao Wang, Beining Wu, Zhiyuan Li,
- Abstract要約: 適応適応適応は、電流への勾配のみを使用する場合、正規化された急降下(NSD)に還元される。
凸設定では、適応性はより強い適応性滑らか性条件で制御される。
適応的滑らかさはネステロフ凸設定による適応の加速を可能にすることを示す。
- 参考スコア(独自算出の注目度): 12.958474356193427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adaptive optimizers can reduce to normalized steepest descent (NSD) when only adapting to the current gradient, suggesting a close connection between the two algorithmic families. A key distinction between their analyses, however, lies in the geometries, e.g., smoothness notions, they rely on. In the convex setting, adaptive optimizers are governed by a stronger adaptive smoothness condition, while NSD relies on the standard notion of smoothness. We extend the theory of adaptive smoothness to the nonconvex setting and show that it precisely characterizes the convergence of adaptive optimizers. Moreover, we establish that adaptive smoothness enables acceleration of adaptive optimizers with Nesterov momentum in the convex setting, a guarantee unattainable under standard smoothness for certain non-Euclidean geometry. We further develop an analogous comparison for stochastic optimization by introducing adaptive gradient variance, which parallels adaptive smoothness and leads to dimension-free convergence guarantees that cannot be achieved under standard gradient variance for certain non-Euclidean geometry.
- Abstract(参考訳): アダプティブ・オプティマイザは、現在の勾配にのみ適応する場合、正規化された急勾配降下(NSD)に還元することができ、2つのアルゴリズムファミリ間の密接な接続を示唆している。
しかし、それらの解析との大きな違いは、例えば滑らかさの概念が依存するジオメトリーにあることである。
凸設定では、適応最適化器はより強い適応的滑らかさ条件で制御され、NSDは滑らかさの標準概念に依存している。
適応的滑らか性の理論を非凸設定に拡張し、適応最適化器の収束を正確に特徴づけることを示す。
さらに、適応的滑らか性は、凸設定におけるネステロフ運動量を持つ適応的最適化器の加速を可能にし、これは、ある非ユークリッド幾何学の標準滑らか性の下では達成できない保証である。
さらに、適応的勾配分散を導入し、適応的滑らかさを並列化し、ある非ユークリッド幾何学の標準勾配分散では達成できない次元自由収束保証をもたらすことによる確率的最適化の類似的な比較を開発する。
関連論文リスト
- Mirror Descent Under Generalized Smoothness [23.5387392871236]
一般ノルムと双対という観点からヘッセンのノルムを測定する新しい$ell*$-smoothnessの概念を導入する。
我々は、古典的な滑らかさの下でのレートに一致するミラー・ディフレッシュ型アルゴリズムの収束性を確立する。
論文 参考訳(メタデータ) (2025-02-02T11:23:10Z) - Adaptive Gradient Normalization and Independent Sampling for (Stochastic) Generalized-Smooth Optimization [23.962901840695462]
既存のアルゴリズムは一般化された非滑らかな幾何学に完全に適応していないことを示す。
実験により,本アルゴリズムによるサンプリング問題の高速収束が示された。
論文 参考訳(メタデータ) (2024-10-17T21:52:00Z) - Gradient-Variation Online Learning under Generalized Smoothness [56.38427425920781]
勾配変分オンライン学習は、オンライン関数の勾配の変化とともにスケールする後悔の保証を達成することを目的としている。
ニューラルネットワーク最適化における最近の取り組みは、一般化された滑らかさ条件を示唆し、滑らかさは勾配ノルムと相関する。
ゲームにおける高速収束と拡張逆最適化への応用について述べる。
論文 参考訳(メタデータ) (2024-08-17T02:22:08Z) - SUPER-ADAM: Faster and Universal Framework of Adaptive Gradients [99.13839450032408]
一般的な問題を解決するための適応アルゴリズムのための普遍的な枠組みを設計することが望まれる。
特に,本フレームワークは,非収束的設定支援の下で適応的手法を提供する。
論文 参考訳(メタデータ) (2021-06-15T15:16:28Z) - Convergence of adaptive algorithms for weakly convex constrained
optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。
我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文 参考訳(メタデータ) (2020-06-11T17:43:19Z) - Adaptivity of Stochastic Gradient Methods for Nonconvex Optimization [71.03797261151605]
適応性は現代最適化理論において重要であるが、研究されていない性質である。
提案アルゴリズムは,PL目標に対して既存のアルゴリズムよりも優れた性能を保ちながら,PL目標に対して最適な収束性を実現することを実証した。
論文 参考訳(メタデータ) (2020-02-13T05:42:27Z) - On the Convergence of Adaptive Gradient Methods for Nonconvex Optimization [80.03647903934723]
我々は、勾配収束法を期待する適応勾配法を証明した。
解析では、非理解勾配境界の最適化において、より適応的な勾配法に光を当てた。
論文 参考訳(メタデータ) (2018-08-16T20:25:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。