Fugu-MT 論文翻訳(概要): A Comprehensive Study on Optimization Strategies for Gradient Descent In Deep Learning

論文の概要: A Comprehensive Study on Optimization Strategies for Gradient Descent In Deep Learning

arxiv url: http://arxiv.org/abs/2101.02397v1
Date: Thu, 7 Jan 2021 06:24:55 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-10 20:18:37.925652
Title: A Comprehensive Study on Optimization Strategies for Gradient Descent In Deep Learning
Title（参考訳）: 深層学習における勾配降下の最適化戦略に関する包括的研究
Authors: Kaustubh Yadav
Abstract要約: この記事では,勾配降下の最適化戦略について紹介する。さらに,これらのアルゴリズムのアーキテクチャや,ニューラルネットワークのさらなる最適化についても論じる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: One of the most important parts of Artificial Neural Networks is minimizing the loss functions which tells us how good or bad our model is. To minimize these losses we need to tune the weights and biases. Also to calculate the minimum value of a function we need gradient. And to update our weights we need gradient descent. But there are some problems with regular gradient descent ie. it is quite slow and not that accurate. This article aims to give an introduction to optimization strategies to gradient descent. In addition, we shall also discuss the architecture of these algorithms and further optimization of Neural Networks in general
Abstract（参考訳）: ニューラルネットワークの最も重要な部分の1つは、モデルがどれほど良いか悪いかを示す損失関数を最小化することです。これらの損失を最小限に抑えるには、重みとバイアスを調整する必要があります。また、関数の最小値を計算するには勾配が必要である。そして、重みを更新するには勾配降下が必要です。しかし、正規勾配降下にはいくつかの問題がある。かなり遅いし、それほど正確ではない。この記事では,勾配降下の最適化戦略について紹介する。さらに、これらのアルゴリズムのアーキテクチャや、ニューラルネットワーク全般のさらなる最適化についても論じる。

関連論文リスト

Gradient Descent with Provably Tuned Learning-rate Schedules [14.391648046717073]
そこで我々は,勾配に基づくアルゴリズムにおいて,因子を確実にチューニングするための新しい解析ツールを開発した。我々の分析は、一般的に使用される活性化関数を持つニューラルネットワークに適用される。
論文参考訳（メタデータ） (2025-12-04T18:49:58Z)
Deep Learning Optimization Using Self-Adaptive Weighted Auxiliary Variables [20.09691024284159]
本稿では,ニューラルネットワークや物理インフォームドネットワークによる学習のための新しいフレームワークを開発する。私たちのフレームワークの堅牢性は、新しい損失が元の問題を最適化するのに役立ちます。
論文参考訳（メタデータ） (2025-04-30T10:43:13Z)
Newton Losses: Using Curvature Information for Learning with Differentiable Algorithms [80.37846867546517]
カスタム目的の8つの異なるニューラルネットワークのトレーニング方法を示す。我々はその2次情報を経験的フィッシャー行列を通して活用する。ロスロスロスシブルアルゴリズムを用いて、少ない微分可能アルゴリズムに対する大幅な改善を実現する。
論文参考訳（メタデータ） (2024-10-24T18:02:11Z)
Gradient-Free Training of Quantized Neural Networks [9.348959582516438]
ニューラルネットワークのトレーニングには、かなりの計算資源とエネルギーが必要である。混合精度と量子化学習はビット使用量を減少させるが、計算コストの高い勾配に基づく最適化に大きく依存している。我々は、勾配を完全に排除するパラダイムシフトを提案する。
論文参考訳（メタデータ） (2024-10-13T05:38:39Z)
Gradient-free neural topology optimization [0.0]
勾配のないアルゴリズムは勾配に基づくアルゴリズムと比較して多くの繰り返しを収束させる必要がある。これにより、反復1回あたりの計算コストとこれらの問題の高次元性のため、トポロジ最適化では実現不可能となった。我々は,潜時空間における設計を最適化する場合に,少なくとも1桁の繰り返し回数の減少につながる事前学習型ニューラルリパラメータ化戦略を提案する。
論文参考訳（メタデータ） (2024-03-07T23:00:49Z)
How to guess a gradient [68.98681202222664]
我々は、勾配が以前考えられていたよりもより構造化されていることを示す。この構造をエクスプロイトすると、勾配のない最適化スキームが大幅に改善される。厳密な勾配の最適化と勾配の推測の間に大きなギャップを克服する上での新たな課題を強調した。
論文参考訳（メタデータ） (2023-12-07T21:40:44Z)
Implicit Bias in Leaky ReLU Networks Trained on High-Dimensional Data [63.34506218832164]
本研究では,ReLUを活性化した2層完全連結ニューラルネットワークにおける勾配流と勾配降下の暗黙的バイアスについて検討する。勾配流には、均一なニューラルネットワークに対する暗黙のバイアスに関する最近の研究を活用し、リーク的に勾配流が2つ以上のランクを持つニューラルネットワークを生成することを示す。勾配降下は, ランダムな分散が十分小さい場合, 勾配降下の1ステップでネットワークのランクが劇的に低下し, トレーニング中もランクが小さくなることを示す。
論文参考訳（メタデータ） (2022-10-13T15:09:54Z)
Scaling Forward Gradient With Local Losses [117.22685584919756]
フォワード学習は、ディープニューラルネットワークを学ぶためのバックプロップに代わる生物学的に妥当な代替手段である。重みよりも活性化に摂動を適用することにより、前方勾配のばらつきを著しく低減できることを示す。提案手法はMNIST と CIFAR-10 のバックプロップと一致し,ImageNet 上で提案したバックプロップフリーアルゴリズムよりも大幅に優れていた。
論文参考訳（メタデータ） (2022-10-07T03:52:27Z)
Gradient Correction beyond Gradient Descent [63.33439072360198]
勾配補正は明らかに、ニューラルネットワークのトレーニングにおいて、最も重要な側面である。勾配補正を行うためのフレームワーク(textbfGCGD)を導入する。実験結果から, 勾配補正フレームワークは, トレーニングエポックスを$sim$20%削減し, ネットワーク性能を向上させることができることがわかった。
論文参考訳（メタデータ） (2022-03-16T01:42:25Z)
Penalizing Gradient Norm for Efficiently Improving Generalization in Deep Learning [13.937644559223548]
ディープニューラルネットワーク(DNN)をうまく一般化するためのトレーニング方法が、ディープラーニングの中心的な関心事である。最適化時の損失関数の勾配ノルムをペナルティ化することにより,モデル一般化を効果的に向上する手法を提案する。
論文参考訳（メタデータ） (2022-02-08T02:03:45Z)
Joint inference and input optimization in equilibrium networks [68.63726855991052]
ディープ均衡モデル(Deep equilibrium model)は、従来のネットワークの深さを予測し、代わりに単一の非線形層の固定点を見つけることによってネットワークの出力を計算するモデルのクラスである。この2つの設定の間には自然なシナジーがあることが示されています。この戦略は、生成モデルのトレーニングや、潜時符号の最適化、デノベートやインペインティングといった逆問題に対するトレーニングモデル、対逆トレーニング、勾配に基づくメタラーニングなど、様々なタスクにおいて実証される。
論文参考訳（メタデータ） (2021-11-25T19:59:33Z)
Combining resampling and reweighting for faithful stochastic optimization [1.52292571922932]
損失関数が複数の項の和であるとき、一般的な方法は勾配降下である。損失関数における複数の項のリプシッツ定数の差は、異なる最小値における異なる分散への勾配降下を引き起こすことを示す。
論文参考訳（メタデータ） (2021-05-31T04:21:25Z)
Reparametrizing gradient descent [0.0]
本稿では,ノルム適応勾配勾配という最適化アルゴリズムを提案する。我々のアルゴリズムは準ニュートン法と比較することもできるが、定常点ではなく根を求める。
論文参考訳（メタデータ） (2020-10-09T20:22:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。