論文の概要: Semi-Implicit Back Propagation
- arxiv url: http://arxiv.org/abs/2002.03516v1
- Date: Mon, 10 Feb 2020 03:26:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 08:19:54.717299
- Title: Semi-Implicit Back Propagation
- Title(参考訳): 半簡易バックプロパゲーション
- Authors: Ren Liu, Xiaoqun Zhang
- Abstract要約: ニューラルネットワークトレーニングのための半単純バック伝搬法を提案する。
ニューロンの差は後方方向に伝播し、パラメータは近位写像で更新される。
MNISTとCIFAR-10の両方の実験により、提案アルゴリズムは損失減少とトレーニング/検証の精度の両方において、より良い性能をもたらすことが示された。
- 参考スコア(独自算出の注目度): 1.5533842336139065
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural network has attracted great attention for a long time and many
researchers are devoted to improve the effectiveness of neural network training
algorithms. Though stochastic gradient descent (SGD) and other explicit
gradient-based methods are widely adopted, there are still many challenges such
as gradient vanishing and small step sizes, which leads to slow convergence and
instability of SGD algorithms. Motivated by error back propagation (BP) and
proximal methods, we propose a semi-implicit back propagation method for neural
network training. Similar to BP, the difference on the neurons are propagated
in a backward fashion and the parameters are updated with proximal mapping. The
implicit update for both hidden neurons and parameters allows to choose large
step size in the training algorithm. Finally, we also show that any fixed point
of convergent sequences produced by this algorithm is a stationary point of the
objective loss function. The experiments on both MNIST and CIFAR-10 demonstrate
that the proposed semi-implicit BP algorithm leads to better performance in
terms of both loss decreasing and training/validation accuracy, compared to SGD
and a similar algorithm ProxBP.
- Abstract(参考訳): ニューラルネットワークは長い間大きな注目を集めており、多くの研究者がニューラルネットワークトレーニングアルゴリズムの有効性向上に力を入れている。
確率勾配降下法(SGD)や他の明示的な勾配に基づく手法は広く採用されているが、勾配の消滅や小さなステップサイズなど多くの課題があるため、SGDアルゴリズムの収束と不安定性が遅くなる。
誤差バック伝播(bp)と近位法に動機づけられ,ニューラルネットワークトレーニングのための半簡易バック伝播法を提案する。
BPと同様に、ニューロンの差は後方方向に伝播し、パラメータは近位マッピングで更新される。
隠れたニューロンとパラメータの両方に対する暗黙の更新により、トレーニングアルゴリズムで大きなステップサイズを選択できる。
最後に、このアルゴリズムによって生成される収束列の固定点は、目的損失関数の定常点であることを示す。
MNIST と CIFAR-10 の両実験により,提案した半単純BP アルゴリズムは,SGD と類似のアルゴリズムである ProxBP と比較して,損失減少とトレーニング/バリデーションの精度の両方において性能が向上することを示した。
関連論文リスト
- Gradient-Free Training of Recurrent Neural Networks using Random Perturbations [1.1742364055094265]
リカレントニューラルネットワーク(RNN)は、チューリング完全性とシーケンシャルな処理能力のために、計算の潜在能力を秘めている。
時間によるバックプロパゲーション(BPTT)は、時間とともにRNNをアンロールすることでバックプロパゲーションアルゴリズムを拡張する。
BPTTは、前方と後方のフェーズをインターリーブし、正確な勾配情報を格納する必要があるなど、大きな欠点に悩まされている。
BPTTと競合するRNNにおける摂動学習に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-05-14T21:15:29Z) - A Bootstrap Algorithm for Fast Supervised Learning [0.0]
ニューラルネットワーク(NN)のトレーニングは通常、勾配降下(および勾配降下(SGD))、ADADELTA、ADAM、制限メモリアルゴリズムなど、ある種の曲線追従手法に依存する。
これらのアルゴリズムの収束は通常、高いレベルの精度を達成するために大量の観測にアクセスできることに依存しており、特定の種類の関数で、これらのアルゴリズムはキャッチするデータポイントの複数のエポックを取ることができる。
ここでは、収束速度が劇的に向上する可能性を秘めている別の手法を探求する: カーブフォローではなく、隠れた層を「疎結合」することなどに依存する。
論文 参考訳(メタデータ) (2023-05-04T18:28:18Z) - Membrane Potential Distribution Adjustment and Parametric Surrogate
Gradient in Spiking Neural Networks [3.485537704990941]
この問題を回避し、SNNをゼロから訓練するために、SG戦略を調査し、適用した。
パラメトリックサロゲート勾配(PSG)法を提案し,SGを反復的に更新し,最終的に最適なサロゲート勾配パラメータを決定する。
実験結果から,提案手法は時間によるバックプロパゲーション(BPTT)アルゴリズムと容易に統合可能であることが示された。
論文 参考訳(メタデータ) (2023-04-26T05:02:41Z) - The Cascaded Forward Algorithm for Neural Network Training [61.06444586991505]
本稿では,ニューラルネットワークのための新しい学習フレームワークであるCascaded Forward(CaFo)アルゴリズムを提案する。
FFとは異なり、我々のフレームワークは各カスケードブロックのラベル分布を直接出力する。
我々のフレームワークでは、各ブロックは独立して訓練できるので、並列加速度システムに容易に展開できる。
論文 参考訳(メタデータ) (2023-03-17T02:01:11Z) - Globally Optimal Training of Neural Networks with Threshold Activation
Functions [63.03759813952481]
しきい値アクティベートを伴うディープニューラルネットワークの重み劣化正規化学習問題について検討した。
ネットワークの特定の層でデータセットを破砕できる場合に、簡易な凸最適化の定式化を導出する。
論文 参考訳(メタデータ) (2023-03-06T18:59:13Z) - Implicit Stochastic Gradient Descent for Training Physics-informed
Neural Networks [51.92362217307946]
物理インフォームドニューラルネットワーク(PINN)は、前方および逆微分方程式問題の解法として効果的に実証されている。
PINNは、近似すべきターゲット関数が高周波またはマルチスケールの特徴を示す場合、トレーニング障害に閉じ込められる。
本稿では,暗黙的勾配降下法(ISGD)を用いてPINNを訓練し,トレーニングプロセスの安定性を向上させることを提案する。
論文 参考訳(メタデータ) (2023-03-03T08:17:47Z) - Learning with Local Gradients at the Edge [14.94491070863641]
我々は、Target Projection Gradient Descent (tpSGD) と呼ばれる新しいバックプロパゲーションフリー最適化アルゴリズムを提案する。
tpSGDは、任意の損失関数を扱うために、直接ランダムターゲット射影を一般化する。
我々は、深層ニューラルネットワークのトレーニングにおけるtpSGDの性能を評価し、マルチ層RNNへのアプローチを拡張した。
論文 参考訳(メタデータ) (2022-08-17T19:51:06Z) - Solving Sparse Linear Inverse Problems in Communication Systems: A Deep
Learning Approach With Adaptive Depth [51.40441097625201]
疎信号回復問題に対するエンドツーエンドの訓練可能なディープラーニングアーキテクチャを提案する。
提案手法は,出力するレイヤ数を学習し,各タスクのネットワーク深さを推論フェーズで動的に調整する。
論文 参考訳(メタデータ) (2020-10-29T06:32:53Z) - Adaptive Gradient Method with Resilience and Momentum [120.83046824742455]
レジリエンスとモメンタム(AdaRem)を用いた適応勾配法を提案する。
AdaRemは、過去の1つのパラメータの変化方向が現在の勾配の方向と一致しているかどうかに応じてパラメータワイズ学習率を調整する。
本手法は,学習速度とテスト誤差の観点から,従来の適応学習率に基づくアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-10-21T14:49:00Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。