Fugu-MT 論文翻訳(概要): Robust Stochastic Optimization via Gradient Quantile Clipping

論文の概要: Robust Stochastic Optimization via Gradient Quantile Clipping

arxiv url: http://arxiv.org/abs/2309.17316v2
Date: Sat, 12 Oct 2024 11:42:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-05 08:19:28.517625
Title: Robust Stochastic Optimization via Gradient Quantile Clipping
Title（参考訳）: 勾配量子クリッピングによるロバスト確率最適化
Authors: Ibrahim Merad, Stéphane Gaïffas,
Abstract要約: グラディエントDescent(SGD)のための量子クリッピング戦略を導入する。通常のクリッピングチェーンとして、グラデーション・ニュー・アウトリージを使用します。本稿では,Huberiles を用いたアルゴリズムの実装を提案する。
参考スコア（独自算出の注目度）: 6.2844649973308835
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We introduce a clipping strategy for Stochastic Gradient Descent (SGD) which uses quantiles of the gradient norm as clipping thresholds. We prove that this new strategy provides a robust and efficient optimization algorithm for smooth objectives (convex or non-convex), that tolerates heavy-tailed samples (including infinite variance) and a fraction of outliers in the data stream akin to Huber contamination. Our mathematical analysis leverages the connection between constant step size SGD and Markov chains and handles the bias introduced by clipping in an original way. For strongly convex objectives, we prove that the iteration converges to a concentrated distribution and derive high probability bounds on the final estimation error. In the non-convex case, we prove that the limit distribution is localized on a neighborhood with low gradient. We propose an implementation of this algorithm using rolling quantiles which leads to a highly efficient optimization procedure with strong robustness properties, as confirmed by our numerical experiments.
Abstract（参考訳）: SGD(Stochastic Gradient Descent)のクリッピング戦略を導入し,クリッピング閾値として勾配ノルムの量子化を用いる。この新たな戦略は、スムーズな目的(凸や非凸)に対して堅牢かつ効率的な最適化アルゴリズムを提供し、ハマー汚染に似たデータストリームにおける重み付きサンプル(無限分散を含む)と少数のアウトレーラを許容することを示した。我々の数学的解析は、一定のステップサイズSGDとマルコフ連鎖の接続を利用し、クリッピングによってもたらされるバイアスを元の方法で処理する。強凸目的に対しては、反復が集中分布に収束し、最終推定誤差に高い確率境界を導出することを証明する。非凸の場合、極限分布が勾配の低い近傍に局在していることを証明する。本稿では, 強靭性を有する高効率な最適化手法を実現するために, 転がり量子化法を応用した本アルゴリズムの実装について, 数値実験により確認した。

関連論文リスト

Decentralized Optimization on Compact Submanifolds by Quantized Riemannian Gradient Tracking [45.147301546565316]
本稿では,コンパクト部分多様体における分散最適化の問題について考察する。エージェントが量子化変数を用いて変数を更新するアルゴリズムを提案する。我々の知る限りでは、量子化の存在下で$mathcalO (1/K)$収束率を達成した最初のアルゴリズムである。
論文参考訳（メタデータ） (2025-06-09T01:57:25Z)
Fast Unconstrained Optimization via Hessian Averaging and Adaptive Gradient Sampling Methods [0.3222802562733786]
ヘシアン・アブラッシングに基づくサブサンプルニュートン法による有限サム予測対象関数の最小化について検討する。これらの方法は不有効であり、ヘッセン近似の固定コストがかかる。本稿では,新しい解析手法を提案し,その実用化に向けた課題を提案する。
論文参考訳（メタデータ） (2024-08-14T03:27:48Z)
Sampling from Gaussian Process Posteriors using Stochastic Gradient Descent [43.097493761380186]
勾配アルゴリズムは線形系を解くのに有効な方法である。最適値に収束しない場合であっても,勾配降下は正確な予測を導出することを示す。実験的に、勾配降下は十分に大規模または不条件の回帰タスクにおいて最先端の性能を達成する。
論文参考訳（メタデータ） (2023-06-20T15:07:37Z)
Faster One-Sample Stochastic Conditional Gradient Method for Composite Convex Minimization [61.26619639722804]
滑らかで非滑らかな項の和として形成される凸有限サム目標を最小化するための条件勾配法(CGM)を提案する。提案手法は, 平均勾配 (SAG) 推定器を備え, 1回に1回のサンプルしか必要としないが, より高度な分散低減技術と同等の高速収束速度を保証できる。
論文参考訳（メタデータ） (2022-02-26T19:10:48Z)
Minibatch vs Local SGD with Shuffling: Tight Convergence Bounds and Beyond [63.59034509960994]
シャッフルに基づく変種(ミニバッチと局所ランダムリシャッフル)について検討する。ポリアック・ロジャシエヴィチ条件を満たす滑らかな函数に対して、これらのシャッフル型不変量(英語版)(shuffling-based variants)がそれらの置換式よりも早く収束することを示す収束境界を得る。我々は, 同期シャッフル法と呼ばれるアルゴリズムの修正を提案し, ほぼ均一な条件下では, 下界よりも収束速度が速くなった。
論文参考訳（メタデータ） (2021-10-20T02:25:25Z)
COCO Denoiser: Using Co-Coercivity for Variance Reduction in Stochastic Convex Optimization [4.970364068620608]
我々は,勾配オラクルによって出力される雑音の推定値を改善するために,凸性およびL平滑性を利用する。問合せ点の数と近さの増加は、より良い勾配推定に繋がることを示す。また、SGD、Adam、STRSAGAといった既存のアルゴリズムにCOCOをプラグインすることで、バニラ設定にもCOCOを適用します。
論文参考訳（メタデータ） (2021-09-07T17:21:09Z)
Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文参考訳（メタデータ） (2021-08-25T21:30:27Z)
Differentiable Annealed Importance Sampling and the Perils of Gradient Noise [68.44523807580438]
Annealed importance sample (AIS) と関連するアルゴリズムは、限界推定のための非常に効果的なツールである。差別性は、目的として限界確率を最適化する可能性を認めるため、望ましい性質である。我々はメトロポリス・ハスティングスのステップを放棄して微分可能アルゴリズムを提案し、ミニバッチ計算をさらに解き放つ。
論文参考訳（メタデータ） (2021-07-21T17:10:14Z)
High Probability Complexity Bounds for Non-Smooth Stochastic Optimization with Heavy-Tailed Noise [51.31435087414348]
アルゴリズムが高い確率で小さな客観的残差を与えることを理論的に保証することが不可欠である。非滑らか凸最適化の既存の方法は、信頼度に依存した複雑性境界を持つ。そこで我々は,勾配クリッピングを伴う2つの手法に対して,新たなステップサイズルールを提案する。
論文参考訳（メタデータ） (2021-06-10T17:54:21Z)
Stochastic Reweighted Gradient Descent [4.355567556995855]
SRG(stochastic reweighted gradient)と呼ばれる重要サンプリングに基づくアルゴリズムを提案する。我々は、提案手法の時間とメモリオーバーヘッドに特に注意を払っています。我々はこの発見を裏付ける実験結果を示す。
論文参考訳（メタデータ） (2021-03-23T04:09:43Z)
Zeroth-Order Hybrid Gradient Descent: Towards A Principled Black-Box Optimization Framework [100.36569795440889]
この作業は、一階情報を必要としない零次最適化(ZO)の反復である。座標重要度サンプリングにおける優雅な設計により,ZO最適化法は複雑度と関数クエリコストの両面において効率的であることを示す。
論文参考訳（メタデータ） (2020-12-21T17:29:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。