Fugu-MT 論文翻訳(概要): Dynamic Momentum Recalibration in Online Gradient Learning

論文の概要: Dynamic Momentum Recalibration in Online Gradient Learning

arxiv url: http://arxiv.org/abs/2603.06120v1
Date: Fri, 06 Mar 2026 10:23:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-09 13:17:45.508998
Title: Dynamic Momentum Recalibration in Online Gradient Learning
Title（参考訳）: オンライングラディエント学習における動的モメンタム校正
Authors: Zhipeng Yao, Rui Yu, Guisong Chang, Ying Li, Yu Zhang, Dazhou Li,
Abstract要約: Gradient Descent(SGD)とその運動量変化は、ディープラーニング最適化のバックボーンを形成する。本研究では信号処理のレンズを通して勾配の更新を再解釈し、固定運動量係数が本質的にバイアスと分散のバランスを歪め、歪んだあるいは最適以下のパラメータの更新をもたらすことを明らかにする。 SGDF(SGD with Filter)を提案する。
参考スコア（独自算出の注目度）: 6.6375578955686345
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Stochastic Gradient Descent (SGD) and its momentum variants form the backbone of deep learning optimization, yet the underlying dynamics of their gradient behavior remain insufficiently understood. In this work, we reinterpret gradient updates through the lens of signal processing and reveal that fixed momentum coefficients inherently distort the balance between bias and variance, leading to skewed or suboptimal parameter updates. To address this, we propose SGDF (SGD with Filter), an optimizer inspired by the principles of Optimal Linear Filtering. SGDF computes an online, time-varying gain to dynamically refine gradient estimation by minimizing the mean-squared error, thereby achieving an optimal trade-off between noise suppression and signal preservation. Furthermore, our approach could extend to other optimizers, showcasing its broad applicability to optimization frameworks. Extensive experiments across diverse architectures and benchmarks demonstrate SGDF surpasses conventional momentum methods and achieves performance on par with or surpassing state-of-the-art optimizers.
Abstract（参考訳）: Stochastic Gradient Descent (SGD)とその運動量変化は、ディープラーニング最適化のバックボーンを形成するが、それらの勾配挙動の基盤となるダイナミクスは、まだ十分に理解されていない。本研究では信号処理のレンズを通して勾配の更新を再解釈し、固定運動量係数が本質的にバイアスと分散のバランスを歪め、歪んだあるいは最適以下のパラメータの更新をもたらすことを明らかにする。そこで我々は,最適線形フィルタの原理に触発された最適化器であるSGDF(SGD with Filter)を提案する。 SGDFは、平均二乗誤差を最小にすることで、動的に勾配推定を洗練し、ノイズ抑制と信号保存の最適なトレードオフを実現する。さらに、我々のアプローチは他のオプティマイザにも拡張できる可能性があり、フレームワークの最適化に広く適用可能であることを示している。多様なアーキテクチャやベンチマークにわたる大規模な実験は、SGDFが従来の運動量法を超越し、最先端のオプティマイザに匹敵する性能を達成していることを示している。

関連論文リスト

Prior-Informed Zeroth-Order Optimization with Adaptive Direction Alignment for Memory-Efficient LLM Fine-Tuning [4.278794376089146]
本稿では,事前インフォームド摂動を組み込んだプラグアンドプレイ手法を提案する。本手法は標準ZO法と比較して収束を著しく加速する。勾配推定器が真の勾配方向とより強く一致することを証明する。
論文参考訳（メタデータ） (2026-01-08T08:27:15Z)
Divergence Minimization Preference Optimization for Diffusion Model Alignment [66.31417479052774]
Divergence Minimization Preference Optimization (DMPO) は、逆KL分散を最小化して拡散モデルを整列する原理的手法である。 DMPOは、異なるベースモデルとテストセットで既存のテクニックを一貫して上回り、適合させることができる。
論文参考訳（メタデータ） (2025-07-10T07:57:30Z)
Gradient Normalization Provably Benefits Nonconvex SGD under Heavy-Tailed Noise [60.92029979853314]
重み付き雑音下でのグラディエントDescence(SGD)の収束を確実にする上での勾配正規化とクリッピングの役割について検討する。我々の研究は、重尾雑音下でのSGDの勾配正規化の利点を示す最初の理論的証拠を提供する。我々は、勾配正規化とクリッピングを取り入れた加速SGD変種を導入し、さらに重み付き雑音下での収束率を高めた。
論文参考訳（メタデータ） (2024-10-21T22:40:42Z)
Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。 EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文参考訳（メタデータ） (2023-12-10T15:22:30Z)
Signal Processing Meets SGD: From Momentum to Filter [6.751292200515355]
ディープラーニングでは、勾配降下(SGD)とその運動量に基づく変種が最適化に広く利用されている。本稿では,信号処理レンズを用いて勾配挙動を解析し,更新に影響を与える重要な要因を分離する。本稿では,ワイナーフィルタの原理に基づく新しいSGDF手法を提案する。
論文参考訳（メタデータ） (2023-11-06T01:41:46Z)
Extrapolation for Large-batch Training in Deep Learning [72.61259487233214]
我々は、バリエーションのホストが、我々が提案する統一されたフレームワークでカバー可能であることを示す。本稿では,この手法の収束性を証明し,ResNet,LSTM,Transformer上での経験的性能を厳格に評価する。
論文参考訳（メタデータ） (2020-06-10T08:22:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。