論文の概要: A Comparison of Optimization Algorithms for Deep Learning
- arxiv url: http://arxiv.org/abs/2007.14166v1
- Date: Tue, 28 Jul 2020 12:42:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 01:45:26.910400
- Title: A Comparison of Optimization Algorithms for Deep Learning
- Title(参考訳): ディープラーニングのための最適化アルゴリズムの比較
- Authors: Derya Soydaner
- Abstract要約: 本研究では,ディープラーニングのための最適化アルゴリズムについて詳細に検討する。
この目的のために、適応勾配法と呼ばれるこれらのアルゴリズムは、教師なしタスクと教師なしタスクの両方に実装されている。
トレーニング中のアルゴリズムの挙動と4つの画像データセットの結果を比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, we have witnessed the rise of deep learning. Deep neural
networks have proved their success in many areas. However, the optimization of
these networks has become more difficult as neural networks going deeper and
datasets becoming bigger. Therefore, more advanced optimization algorithms have
been proposed over the past years. In this study, widely used optimization
algorithms for deep learning are examined in detail. To this end, these
algorithms called adaptive gradient methods are implemented for both supervised
and unsupervised tasks. The behaviour of the algorithms during training and
results on four image datasets, namely, MNIST, CIFAR-10, Kaggle Flowers and
Labeled Faces in the Wild are compared by pointing out their differences
against basic optimization algorithms.
- Abstract(参考訳): 近年、我々はディープラーニングの台頭を目撃している。
ディープニューラルネットワークは多くの分野で成功している。
しかし、ニューラルネットワークがより深くなり、データセットが大きくなるにつれて、これらのネットワークの最適化はますます難しくなっている。
そのため、近年より高度な最適化アルゴリズムが提案されている。
本研究では,深層学習のための最適化アルゴリズムについて詳細に検討する。
この目的のために、適応勾配法と呼ばれるこれらのアルゴリズムは教師なしタスクと教師なしタスクの両方に実装されている。
MNIST, CIFAR-10, Kaggle Flowers, Labeled Faces in the Wildの4つの画像データセットにおけるトレーニング中のアルゴリズムの挙動と結果を比較し, 基本的な最適化アルゴリズムとの違いを指摘する。
関連論文リスト
- The Cascaded Forward Algorithm for Neural Network Training [61.06444586991505]
本稿では,ニューラルネットワークのための新しい学習フレームワークであるCascaded Forward(CaFo)アルゴリズムを提案する。
FFとは異なり、我々のフレームワークは各カスケードブロックのラベル分布を直接出力する。
我々のフレームワークでは、各ブロックは独立して訓練できるので、並列加速度システムに容易に展開できる。
論文 参考訳(メタデータ) (2023-03-17T02:01:11Z) - Optimization Methods in Deep Learning: A Comprehensive Overview [0.0]
深層学習は、画像認識、自然言語処理、音声認識など様々な分野で顕著な成功を収めてきた。
ディープラーニングの有効性は、ディープニューラルネットワークのトレーニングに使用される最適化方法に大きく依存する。
本稿では、勾配勾配、Adagrad、Adadelta、RMSpropなどの一階最適化手法の概要と、NesterovAccelered gradient、Adam、Nadam、AdaMax、AMSGradといった最近の運動量ベースおよび適応勾配法について概説する。
論文 参考訳(メタデータ) (2023-02-19T13:01:53Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Learning with Differentiable Algorithms [6.47243430672461]
この論文は、古典的なアルゴリズムとニューラルネットワークのような機械学習システムを組み合わせることを探求している。
この論文はアルゴリズムの監督という概念を定式化し、ニューラルネットワークがアルゴリズムから、あるいは、アルゴリズムと連動して学ぶことを可能にする。
さらに、この論文では、微分可能なソートネットワーク、微分可能なソートゲート、微分可能な論理ゲートネットワークなど、微分可能なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-01T17:30:00Z) - On the Convergence of Distributed Stochastic Bilevel Optimization
Algorithms over a Network [55.56019538079826]
バイレベル最適化は、幅広い機械学習モデルに適用されている。
既存のアルゴリズムの多くは、分散データを扱うことができないように、シングルマシンの設定を制限している。
そこで我々は,勾配追跡通信機構と2つの異なる勾配に基づく分散二段階最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-06-30T05:29:52Z) - Training Neural Networks using SAT solvers [1.0152838128195465]
本稿では,SATソルバを用いてニューラルネットワークのトレーニングを行うグローバル最適化手法を提案する。
実験では,パリティ学習などのタスクにおいて,ADAMオプティマイザに対するアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2022-06-10T01:31:12Z) - Analytically Tractable Inference in Deep Neural Networks [0.0]
Tractable Approximate Inference (TAGI)アルゴリズムは、浅いフルコネクテッドニューラルネットワークのバックプロパゲーションに対する実行可能でスケーラブルな代替手段であることが示された。
従来のディープニューラルネットワークアーキテクチャをトレーニングするために、TAGIがバックプロパゲーションのパフォーマンスとどのように一致するか、または上回るかを実証しています。
論文 参考訳(メタデータ) (2021-03-09T14:51:34Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Towards Understanding the Behaviors of Optimal Deep Active Learning
Algorithms [19.65665942630067]
アクティブラーニング(AL)アルゴリズムは、モデルがデータ選択プロセスを導くため、より少ないデータでより良いパフォーマンスを達成できます。
alの最適形状についてはほとんど研究されていないため、研究者たちはモデルがどこが不足しているかを理解するのに役立つだろう。
我々は,この最適オラクルを探索し,いくつかのタスクで解析するシミュレーションアニーリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-29T22:56:42Z) - Learning to Stop While Learning to Predict [85.7136203122784]
多くのアルゴリズムにインスパイアされたディープモデルは全ての入力に対して固定深度に制限される。
アルゴリズムと同様に、深いアーキテクチャの最適深さは、異なる入力インスタンスに対して異なるかもしれない。
本稿では, ステアブルアーキテクチャを用いて, この様々な深さ問題に対処する。
学習した深層モデルと停止ポリシーにより,多様なタスクセットのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2020-06-09T07:22:01Z) - Large Batch Training Does Not Need Warmup [111.07680619360528]
大きなバッチサイズを使用してディープニューラルネットワークをトレーニングすることは、有望な結果を示し、多くの現実世界のアプリケーションに利益をもたらしている。
本稿では,大規模バッチ学習のための全層適応レートスケーリング(CLARS)アルゴリズムを提案する。
分析に基づいて,このギャップを埋め,3つの一般的な大規模バッチトレーニング手法の理論的洞察を提示する。
論文 参考訳(メタデータ) (2020-02-04T23:03:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。