Fugu-MT 論文翻訳(概要): Improved Stability and Generalization Guarantees of the Decentralized SGD Algorithm

論文の概要: Improved Stability and Generalization Guarantees of the Decentralized SGD Algorithm

arxiv url: http://arxiv.org/abs/2306.02939v4
Date: Thu, 13 Jun 2024 15:09:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-15 02:29:06.786216
Title: Improved Stability and Generalization Guarantees of the Decentralized SGD Algorithm
Title（参考訳）: 分散SGDアルゴリズムの安定性と一般化保証の改善
Authors: Batiste Le Bars, Aurélien Bellet, Marc Tommasi, Kevin Scaman, Giovanni Neglia,
Abstract要約: 本稿では,アルゴリズムの安定性に基づく分散勾配 Descent (D-SGD) の新しい一般化解析法を提案する。この新たな発見は、グラフの選択が、最悪の凸関数と非連結関数を実際に改善できることを明らかにしている。
参考スコア（独自算出の注目度）: 33.64407835198723
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper presents a new generalization error analysis for Decentralized Stochastic Gradient Descent (D-SGD) based on algorithmic stability. The obtained results overhaul a series of recent works that suggested an increased instability due to decentralization and a detrimental impact of poorly-connected communication graphs on generalization. On the contrary, we show, for convex, strongly convex and non-convex functions, that D-SGD can always recover generalization bounds analogous to those of classical SGD, suggesting that the choice of graph does not matter. We then argue that this result is coming from a worst-case analysis, and we provide a refined optimization-dependent generalization bound for general convex functions. This new bound reveals that the choice of graph can in fact improve the worst-case bound in certain regimes, and that surprisingly, a poorly-connected graph can even be beneficial for generalization.
Abstract（参考訳）: 本稿では,アルゴリズムの安定性に基づく分散確率勾配 Descent (D-SGD) の新しい一般化誤差解析法を提案する。その結果、分散化による不安定性の増大と、疎結合な通信グラフの一般化に対する有害な影響が示唆された最近の一連の研究がオーバーホールされた。逆に、凸、強凸、非凸関数に対して、D-SGDは古典的なSGDと類似した一般化境界を常に回復できることを示し、グラフの選択は重要でないことを示唆する。そして、この結果は最悪のケース解析の結果であり、一般凸関数に対して洗練された最適化依存の一般化を提供する。この新たなバウンドは、グラフの選択がある種のレジームにおける最悪のケースバウンドを改善することができ、驚くべきことに、連結されていないグラフが一般化に有用であることを示している。

関連論文リスト

Algorithmic Stability of Stochastic Gradient Descent with Momentum under Heavy-Tailed Noise [20.922456964393213]
重み付き雑音下での運動量(SGDm)を持つSGDの一般化境界を確立する。二次損失関数に対して、SGDm は運動量や重みのあるテールの存在においてより悪い一般化を持つことを示す。我々の知る限り、縮退した雑音を持つSDEにおいて、その種類の最初の結果となる一様時間離散化誤差境界を開発する。
論文参考訳（メタデータ） (2025-02-02T19:25:48Z)
Stability and Generalization of the Decentralized Stochastic Gradient Descent Ascent Algorithm [80.94861441583275]
本稿では,分散勾配勾配(D-SGDA)アルゴリズムの一般化境界の複雑さについて検討する。本研究は,D-SGDAの一般化における各因子の影響を解析した。また、最適凸凹設定を得るために一般化とバランスをとる。
論文参考訳（メタデータ） (2023-10-31T11:27:01Z)
On the Convergence to a Global Solution of Shuffling-Type Gradient Algorithms [18.663264755108703]
勾配降下アルゴリズム (SGD) は、多くの機械学習タスクにおいて選択の方法である。本稿では,SGDが凸設定として望まれる計算一般複雑性を達成したことを示す。
論文参考訳（メタデータ） (2022-06-13T01:25:59Z)
Benign Underfitting of Stochastic Gradient Descent [72.38051710389732]
本研究では,適切な学習データを得ることで,一般化性能を実現する「従来型」学習ルールとして,勾配降下度(SGD)がどの程度理解されるかを検討する。類似現象が起こらない近縁な交換SGDを解析し、その集団リスクが実際に最適な速度で収束することを証明する。
論文参考訳（メタデータ） (2022-02-27T13:25:01Z)
The Benefits of Implicit Regularization from SGD in Least Squares Problems [116.85246178212616]
勾配降下(SGD)はアルゴリズム正則化効果が強い。我々は、(正規化されていない)平均SGDで得られる暗黙の正則化とリッジ回帰の明示的な正則化の比較を行う。
論文参考訳（メタデータ） (2021-08-10T09:56:47Z)
Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは経験的に過剰フィットを防げる中心的存在ですこの研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文参考訳（メタデータ） (2021-03-23T17:15:53Z)
SGD Generalizes Better Than GD (And Regularization Doesn't Help) [39.588906680621825]
我々は、勾配勾配(SGD)の一般化性能と全バッチ勾配(GD)の分離結果を与える。同じステップ数で、GD はオーバーフィットし、$Omega(1)$ generalization error で解を出力することを示した。本稿では,GDによる経験的リスクの最小化が,基本的には上記の結果を変えるものではないことを論じ,安定性,暗黙バイアス,一般化における学習アルゴリズムの役割を再考する。
論文参考訳（メタデータ） (2021-02-01T19:18:40Z)
An improved convergence analysis for decentralized online stochastic non-convex optimization [17.386715847732468]
本稿では,GT-Loakjasiewics(GT-Loakjasiewics)と呼ばれる手法が,GT-Loakjasiewics(GT-Loakjasiewics)が現在の収束率を満たすことを示す。結果はすぐに適用できるだけでなく、現在知られている最高の収束率にも適用できる。
論文参考訳（メタデータ） (2020-08-10T15:29:13Z)
When Does Preconditioning Help or Hurt Generalization? [74.25170084614098]
本稿では,第1次および第2次手法のテキスト単純バイアスが一般化特性の比較にどのように影響するかを示す。本稿では、バイアス分散トレードオフを管理するためのいくつかのアプローチと、GDとNGDを補間する可能性について論じる。
論文参考訳（メタデータ） (2020-06-18T17:57:26Z)
Stability of Stochastic Gradient Descent on Nonsmooth Convex Losses [52.039438701530905]
任意のリプシッツ非平滑凸損失に対して,数種類の勾配勾配降下(SGD)に対して,鋭い上下境界を与える。我々の限界は、極端に過剰な集団リスクを伴う、微分的にプライベートな非平滑凸最適化のための新しいアルゴリズムを導出することを可能にする。
論文参考訳（メタデータ） (2020-06-12T02:45:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。