Fugu-MT 論文翻訳(概要): An SDE for Modeling SAM: Theory and Insights

論文の概要: An SDE for Modeling SAM: Theory and Insights

arxiv url: http://arxiv.org/abs/2301.08203v1
Date: Thu, 19 Jan 2023 17:54:50 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-20 14:22:33.638933
Title: An SDE for Modeling SAM: Theory and Insights
Title（参考訳）: SAMモデリングのためのSDE:理論と展望
Authors: Enea Monzio Compagnoni, Antonio Orvieto, Luca Biggio, Hans Kersting, Frank Norbert Proske, Aurelien Lucchi
Abstract要約: 最近注目されているSAM(Sharpness-Aware Minimization)について検討する。我々の主な貢献はSAMとその非正規化USAMに対する連続時間モデル(SDEの形で)の導出である。
参考スコア（独自算出の注目度）: 7.1967126772249586
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We study the SAM (Sharpness-Aware Minimization) optimizer which has recently attracted a lot of interest due to its increased performance over more classical variants of stochastic gradient descent. Our main contribution is the derivation of continuous-time models (in the form of SDEs) for SAM and its unnormalized variant USAM, both for the full-batch and mini-batch settings. We demonstrate that these SDEs are rigorous approximations of the real discrete-time algorithms (in a weak sense, scaling linearly with the step size). Using these models, we then offer an explanation of why SAM prefers flat minima over sharp ones - by showing that it minimizes an implicitly regularized loss with a Hessian-dependent noise structure. Finally, we prove that perhaps unexpectedly SAM is attracted to saddle points under some realistic conditions. Our theoretical results are supported by detailed experiments.
Abstract（参考訳）: より古典的な確率勾配勾配よりも高い性能を持つSAM(Sharpness-Aware Minimization)オプティマイザについて検討した。我々の主な貢献は、SAMの連続時間モデル(SDEの形で)とその非正規化されたUSAM(フルバッチとミニバッチの両方)の導出である。これらのSDEは実離散時間アルゴリズムの厳密な近似であることを示す(弱い意味では、ステップサイズと線形にスケーリングする)。これらのモデルを用いて、SAMがシャープなモデルよりもフラットなミニマを好む理由を説明する。最後に、SAMが現実的な条件下でのサドル点に惹かれていることを証明する。我々の理論結果は詳細な実験によって裏付けられている。

関連論文リスト

Sparse Layer Sharpness-Aware Minimization for Efficient Fine-Tuning [52.63618112418439]
シャープネス対応計算(SAM)は、細調整を含む機械学習タスクの一般化性能を改善するために、平らなロスランドスケープを持つミニマを求める。本稿では,層にスパース手法を導入することにより,このボトルネックを解消するアプローチSL-SAMを提案する。
論文参考訳（メタデータ） (2026-02-10T04:05:43Z)
LightSAM: Parameter-Agnostic Sharpness-Aware Minimization [92.17866492331524]
シャープネス・アウェアの最小化(SAM)は、重量摂動を通して平らなミニマランドスケープを探索することにより、機械学習モデルの能力を高める。 SAMはさらなるハイパーパラメータ、摂動半径を導入し、SAMの感度を誘導する。本稿では,SAMの摂動半径と学習速度を適応的に設定するアルゴリズムLightSAMを提案する。
論文参考訳（メタデータ） (2025-05-30T09:28:38Z)
Monge SAM: Robust Reparameterization-Invariant Sharpness-Aware Minimization Based on Loss Geometry [2.854482269849925]
シャープネスを意識した最小化(SAM)は、逆方向の摂動の勾配に応じてパラメータを更新することにより、平坦な領域を効率的に見つける。我々はSAMの再パラメータ化不変バージョンであるMonge SAM (M-SAM)を提案する。理論的にも経験的にも、マルチモーダルな表現アライメントタスクにおいて、この振る舞いを実証する。
論文参考訳（メタデータ） (2025-02-12T14:40:19Z)
Sharpness-Aware Minimization Efficiently Selects Flatter Minima Late in Training [47.25594539120258]
Sharpness-Aware Minimization (SAM) はトレーニングの遅滞時に効率よくフラットなミニマを選択する。 SAMの訓練の終わりに応用されたいくつかのエポックでさえ、完全なSAMトレーニングとほぼ同じ一般化と解のシャープネスをもたらす。我々は、最終解の物性を形作る上で、最終相で選択した最適化法がより重要であると推測する。
論文参考訳（メタデータ） (2024-10-14T10:56:42Z)
Bilateral Sharpness-Aware Minimization for Flatter Minima [61.17349662062522]
Sharpness-Aware Minimization (SAM) は Max-Sharpness (MaxS) を減らして一般化を促進する本稿では,現在の重量を囲む周辺地域のトレーニング損失と最小損失の差を利用して,Min-Sharpness (MinS) と表現する。 MaxSとMinSをマージすることで、最適化中により平坦な方向を示すより良いFIを作成しました。特に、このFIをSAMと組み合わせて提案されたバイラテラルSAM(BSAM)に組み込むことにより、SAMよりもより平坦な最小値を求めることができます。
論文参考訳（メタデータ） (2024-09-20T03:01:13Z)
Friendly Sharpness-Aware Minimization [62.57515991835801]
シャープネス・アウェアの最小化(SAM)は、トレーニング損失とロスシャープネスの両方を最小化することにより、ディープニューラルネットワークトレーニングの改善に役立っている。対向性摂動におけるバッチ特異的勾配雑音の主な役割,すなわち現在のミニバッチ勾配について検討する。逆勾配雑音成分を分解することにより、全勾配のみに依存すると一般化が低下し、除くと性能が向上することがわかった。
論文参考訳（メタデータ） (2024-03-19T01:39:33Z)
Systematic Investigation of Sparse Perturbed Sharpness-Aware Minimization Optimizer [158.2634766682187]
ディープニューラルネットワークは、複雑で非構造的なロスランドスケープのため、しばしば一般化の貧弱さに悩まされる。 SharpnessAware Minimization (SAM) は、摂動を加える際の景観の変化を最小限に抑えることで損失を平滑化するポピュラーなソリューションである。本稿では,二元マスクによる摂動を効果的かつ効果的に行う訓練手法であるスパースSAMを提案する。
論文参考訳（メタデータ） (2023-06-30T09:33:41Z)
AdaSAM: Boosting Sharpness-Aware Minimization with Adaptive Learning Rate and Momentum for Training Deep Neural Networks [76.90477930208982]
シャープネス認識(SAM)は、ディープニューラルネットワークのトレーニングにおいて、より一般的なものにするため、広範囲に研究されている。 AdaSAMと呼ばれる適応的な学習摂動と運動量加速度をSAMに統合することはすでに検討されている。いくつかのNLPタスクにおいて,SGD,AMS,SAMsGradと比較して,AdaSAMが優れた性能を発揮することを示す実験を行った。
論文参考訳（メタデータ） (2023-03-01T15:12:42Z)
mSAM: Micro-Batch-Averaged Sharpness-Aware Minimization [20.560184120992094]
シャープネス・アウェアの最小化手法は、フラットな最小化に向けて勾配降下法を操る基本損失関数を変更する。我々は最近開発されたフラットネス解析のためのよく研究された一般的なフレームワークを拡張し、SAMがSGDよりもフラットなミニマを達成し、mSAMがSAMよりもフラットなミニマを達成できることを理論的に示す。
論文参考訳（メタデータ） (2023-02-19T23:27:12Z)
SAM operates far from home: eigenvalue regularization as a dynamical phenomenon [15.332235979022036]
シャープネス認識最小化(SAM)アルゴリズムは、ロス・ヘッセンの大きな固有値を制御することが示されている。 SAMは学習軌跡全体を通して固有値の強い正規化を提供することを示す。本理論は,学習速度とSAM半径パラメータの関数として最大固有値を予測する。
論文参考訳（メタデータ） (2023-02-17T04:51:20Z)
Stability Analysis of Sharpness-Aware Minimization [5.024497308975435]
Sharpness-Aware(SAM)は、ディープラーニングにおいてフラットなミニマを見つけるための、最近提案されたトレーニング手法である。本稿では,SAM力学がサドル点付近で発生する収束不安定性を有することを示す。
論文参考訳（メタデータ） (2023-01-16T08:42:40Z)
Towards Understanding Sharpness-Aware Minimization [27.666483899332643]
Sharpness-Aware Minimization (SAM) の成功に対する既存の正当化は、PACBayes の一般化に基づいていると論じる。対角線ネットワークの暗黙バイアスを理論的に解析する。 SAMで標準モデルを微調整することで、非シャープネットワークの特性を大幅に改善できることを示す。
論文参考訳（メタデータ） (2022-06-13T15:07:32Z)
Towards Efficient and Scalable Sharpness-Aware Minimization [81.22779501753695]
内部勾配の上昇を周期的に計算する新しいアルゴリズム LookSAM を提案する。 LookSAMはSAMと同じような精度を実現し、非常に高速である。 Vision Transformer(ViTs)のトレーニングでバッチサイズのスケールアップに成功したのは,私たちが初めてです。
論文参考訳（メタデータ） (2022-03-05T11:53:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。