Fugu-MT 論文翻訳(概要): On the influence of roundoff errors on the convergence of the gradient descent method with low-precision floating-point computation

論文の概要: On the influence of roundoff errors on the convergence of the gradient descent method with low-precision floating-point computation

arxiv url: http://arxiv.org/abs/2202.12276v1
Date: Thu, 24 Feb 2022 18:18:20 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-25 16:35:35.061704
Title: On the influence of roundoff errors on the convergence of the gradient descent method with low-precision floating-point computation
Title（参考訳）: 低精度浮動小数点計算による勾配降下法の収束性に及ぼすラウンドオフ誤差の影響
Authors: Lu Xia, Stefano Massei, Michiel Hochstenbach and Barry Koren
Abstract要約: ゼロバイアス特性を小さな勾配を維持する確率で交換する新しいラウンドリング方式を提案する。提案手法は,各イテレーションにおいて降下方向にある一定の丸みバイアスを生じさせる。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The employment of stochastic rounding schemes helps prevent stagnation of convergence, due to vanishing gradient effect when implementing the gradient descent method in low precision. Conventional stochastic rounding achieves zero bias by preserving small updates with probabilities proportional to their relative magnitudes. In this study, we propose a new stochastic rounding scheme that trades the zero bias property with a larger probability to preserve small gradients. Our method yields a constant rounding bias that, at each iteration, lies in a descent direction. For convex problems, we prove that the proposed rounding method has a beneficial effect on the convergence rate of gradient descent. We validate our theoretical analysis by comparing the performances of various rounding schemes when optimizing a multinomial logistic regression model and when training a simple neural network with 8-bit floating-point format.
Abstract（参考訳）: 確率的ラウンドリングスキームの利用は、勾配降下法を低精度で実装する際の勾配効果の消失による収束の停滞を防ぐのに役立つ。従来の確率的丸めは、相対的な大きさに比例する確率で小さな更新を保存することでゼロバイアスを達成する。本研究では,ゼロバイアス特性をより大きい確率で交換し,小さな勾配を保存する新しい確率的丸めスキームを提案する。提案手法は,各イテレーションにおいて降下方向にある一定の丸みバイアスを生じさせる。凸問題に対しては,提案手法が勾配降下の収束率に有益であることを証明した。本研究では,多項ロジスティック回帰モデルの最適化と8ビット浮動小数点形式を用いた単純なニューラルネットワークの学習において,様々な丸めスキームの性能を比較することにより,理論解析を検証する。

関連論文リスト

Randomised Splitting Methods and Stochastic Gradient Descent [0.0]
勾配最適化のための新しいミニバッチ戦略(Symmetric Minibatching Strategy)を導入する。我々は,Lynov技術を用いたこの新しいミニバッチ戦略に対して,コンバージェンス保証の改善を提供する。また、段階的なスケジュールの縮小を考慮すると、収束速度が速くなるとも論じている。
論文参考訳（メタデータ） (2025-04-05T20:07:34Z)
An Adaptive Stochastic Gradient Method with Non-negative Gauss-Newton Stepsizes [17.804065824245402]
機械学習の応用では、各損失関数は非負であり、平方根とその実数値平方根の構成として表すことができる。本稿では, ガウス・ニュートン法やレフスカルト法を適用して, 滑らかだが非負な関数の平均を最小化する方法を示す。
論文参考訳（メタデータ） (2024-07-05T08:53:06Z)
Flattened one-bit stochastic gradient descent: compressed distributed optimization with controlled variance [55.01966743652196]
パラメータ・サーバ・フレームワークにおける圧縮勾配通信を用いた分散勾配降下(SGD)のための新しいアルゴリズムを提案する。平坦な1ビット勾配勾配勾配法(FO-SGD)は2つの単純なアルゴリズムの考え方に依存している。
論文参考訳（メタデータ） (2024-05-17T21:17:27Z)
Stochastic Gradient Descent for Gaussian Processes Done Right [86.83678041846971]
emphdone right -- 最適化とカーネルコミュニティからの具体的な洞察を使用するという意味で -- が、勾配降下は非常に効果的であることを示している。本稿では,直感的に設計を記述し,設計選択について説明する。本手法は,分子結合親和性予測のための最先端グラフニューラルネットワークと同程度にガウス過程の回帰を配置する。
論文参考訳（メタデータ） (2023-10-31T16:15:13Z)
One-step corrected projected stochastic gradient descent for statistical estimation [49.1574468325115]
これは、Fisherスコアリングアルゴリズムの1ステップで修正されたログ様関数の予測勾配勾配に基づいている。理論およびシミュレーションにより、平均勾配勾配や適応勾配勾配の通常の勾配勾配の代替として興味深いものであることを示す。
論文参考訳（メタデータ） (2023-06-09T13:43:07Z)
On the Convergence of the Gradient Descent Method with Stochastic Fixed-point Rounding Errors under the Polyak-Lojasiewicz Inequality [0.0]
適切なラウンドリング戦略を選択すると勾配の問題が排除され、降下方向のバイアスが強いため、バイアス付きラウンドリング誤差は有益である可能性が示唆された。我々は、偏りのない丸めによって達成されるものよりも厳密な収束率の限界を得る。
論文参考訳（メタデータ） (2023-01-23T16:02:54Z)
Differentiable Annealed Importance Sampling and the Perils of Gradient Noise [68.44523807580438]
Annealed importance sample (AIS) と関連するアルゴリズムは、限界推定のための非常に効果的なツールである。差別性は、目的として限界確率を最適化する可能性を認めるため、望ましい性質である。我々はメトロポリス・ハスティングスのステップを放棄して微分可能アルゴリズムを提案し、ミニバッチ計算をさらに解き放つ。
論文参考訳（メタデータ） (2021-07-21T17:10:14Z)
High-probability Bounds for Non-Convex Stochastic Optimization with Heavy Tails [55.561406656549686]
我々は、勾配推定が末尾を持つ可能性のある一階アルゴリズムを用いたヒルベルト非最適化を考える。本研究では, 勾配, 運動量, 正規化勾配勾配の収束を高確率臨界点に収束させることと, 円滑な損失に対する最もよく知られた繰り返しを示す。
論文参考訳（メタデータ） (2021-06-28T00:17:01Z)
Path Sample-Analytic Gradient Estimators for Stochastic Binary Networks [78.76880041670904]
二進的アクティベーションや二進的重みを持つニューラルネットワークでは、勾配降下によるトレーニングは複雑である。そこで本研究では,サンプリングと解析近似を併用した新しい推定法を提案する。勾配推定において高い精度を示し、深部畳み込みモデルにおいてより安定かつ優れた訓練を行うことを示す。
論文参考訳（メタデータ） (2020-06-04T21:51:21Z)
Non-asymptotic bounds for stochastic optimization with biased noisy gradient oracles [8.655294504286635]
関数の測定値が推定誤差を持つ設定を捉えるために,バイアス付き勾配オラクルを導入する。提案するオラクルは,例えば,独立分散シミュレーションと同一分散シミュレーションのバッチによるリスク計測推定の実践的な状況にある。
論文参考訳（メタデータ） (2020-02-26T12:53:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。