論文の概要: A Shooting Formulation of Deep Learning
- arxiv url: http://arxiv.org/abs/2006.10330v2
- Date: Tue, 8 Dec 2020 15:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 09:58:50.957442
- Title: A Shooting Formulation of Deep Learning
- Title(参考訳): 深層学習の射程定式化
- Authors: Fran\c{c}ois-Xavier Vialard (ligm), Roland Kwitt, Susan Wei, Marc
Niethammer
- Abstract要約: 本稿では,ネットワーク層ごとのパラメータ化から,最適ネットワーク上でのパラメータ化へと視点を転換するシューティング定式化を提案する。
拡張性のために,連続深度ニューラルネットワークの最適重み軌跡を同定する新しい粒子アンサンブルパラメトリゼーションを提案する。
- 参考スコア(独自算出の注目度): 19.51427735087011
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Continuous-depth neural networks can be viewed as deep limits of discrete
neural networks whose dynamics resemble a discretization of an ordinary
differential equation (ODE). Although important steps have been taken to
realize the advantages of such continuous formulations, most current techniques
are not truly continuous-depth as they assume \textit{identical} layers.
Indeed, existing works throw into relief the myriad difficulties presented by
an infinite-dimensional parameter space in learning a continuous-depth neural
ODE. To this end, we introduce a shooting formulation which shifts the
perspective from parameterizing a network layer-by-layer to parameterizing over
optimal networks described only by a set of initial conditions. For
scalability, we propose a novel particle-ensemble parametrization which fully
specifies the optimal weight trajectory of the continuous-depth neural network.
Our experiments show that our particle-ensemble shooting formulation can
achieve competitive performance, especially on long-range forecasting tasks.
Finally, though the current work is inspired by continuous-depth neural
networks, the particle-ensemble shooting formulation also applies to
discrete-time networks and may lead to a new fertile area of research in deep
learning parametrization.
- Abstract(参考訳): 連続深度ニューラルネットワークは、通常の微分方程式(ODE)の離散化に似ている離散ニューラルネットワークの深い限界と見なすことができる。
このような連続的な定式化の利点を実現するために重要なステップが取られてきたが、現在のほとんどの手法は真に連続的な深さではない。
実際、既存の研究は、連続深さのニューラルODEを学習する際に無限次元のパラメータ空間によって提示される無数の困難を緩和する。
そこで本研究では,ネットワーク層毎のパラメータ化から,初期条件の組によってのみ記述される最適ネットワーク上でのパラメータ化へ,視点をシフトするシューティング方式を提案する。
拡張性のために,連続深度ニューラルネットワークの最適重み軌跡を同定する新しい粒子アンサンブルパラメトリゼーションを提案する。
実験により, 粒子アンサンブル射撃の定式化は, 特に長距離予測タスクにおいて, 競争性能を向上できることが示された。
最後に、現在の研究は連続的な深層ニューラルネットワークにインスパイアされているが、粒子アンサンブル射撃の定式化は離散時間ネットワークにも適用され、深層学習のパラメトリゼーションにおける新たな研究領域につながる可能性がある。
関連論文リスト
- Implicit regularization of deep residual networks towards neural ODEs [8.075122862553359]
我々は、ニューラルネットワークに対する深い残留ネットワークの暗黙的な正規化を確立する。
ネットワークがニューラルなODEの離散化であるなら、そのような離散化はトレーニングを通して維持される。
論文 参考訳(メタデータ) (2023-09-03T16:35:59Z) - Addressing caveats of neural persistence with deep graph persistence [54.424983583720675]
神経の持続性に影響を与える主な要因は,ネットワークの重みのばらつきと大きな重みの空間集中である。
単一層ではなく,ニューラルネットワーク全体へのニューラルネットワークの持続性に基づくフィルタリングの拡張を提案する。
これにより、ネットワーク内の永続的なパスを暗黙的に取り込み、分散に関連する問題を緩和するディープグラフの永続性測定が得られます。
論文 参考訳(メタデータ) (2023-07-20T13:34:11Z) - Globally Optimal Training of Neural Networks with Threshold Activation
Functions [63.03759813952481]
しきい値アクティベートを伴うディープニューラルネットワークの重み劣化正規化学習問題について検討した。
ネットワークの特定の層でデータセットを破砕できる場合に、簡易な凸最適化の定式化を導出する。
論文 参考訳(メタデータ) (2023-03-06T18:59:13Z) - Simple initialization and parametrization of sinusoidal networks via
their kernel bandwidth [92.25666446274188]
従来の活性化機能を持つネットワークの代替として、活性化を伴う正弦波ニューラルネットワークが提案されている。
まず,このような正弦波ニューラルネットワークの簡易版を提案する。
次に、ニューラルタンジェントカーネルの観点からこれらのネットワークの挙動を分析し、そのカーネルが調整可能な帯域幅を持つ低域フィルタを近似することを実証する。
論文 参考訳(メタデータ) (2022-11-26T07:41:48Z) - FFNB: Forgetting-Free Neural Blocks for Deep Continual Visual Learning [14.924672048447338]
我々は、新しい忘れのないニューラルブロック(FFNB)に基づく連続学習のための動的ネットワークアーキテクチャを考案する。
FFNB機能を新しいタスクでトレーニングするには、以前のタスクのnull-スペースのパラメータを制約する新しいプロシージャを使用する。
論文 参考訳(メタデータ) (2021-11-22T17:23:34Z) - Training Integrable Parameterizations of Deep Neural Networks in the
Infinite-Width Limit [0.0]
大きな幅のダイナミクスは実世界のディープネットワークに関する実践的な洞察を導いてきた。
2層ニューラルネットワークでは、トレーニングされたモデルの性質が初期ランダムウェイトの大きさによって根本的に変化することが理解されている。
この自明な振る舞いを避けるための様々な手法を提案し、その結果のダイナミクスを詳細に分析する。
論文 参考訳(メタデータ) (2021-10-29T07:53:35Z) - Generalization bound of globally optimal non-convex neural network
training: Transportation map estimation by infinite dimensional Langevin
dynamics [50.83356836818667]
本稿では,ディープラーニングの最適化を一般化誤差と関連づけて解析する理論フレームワークを提案する。
ニューラルネットワーク最適化分析のための平均場理論やニューラル・タンジェント・カーネル理論のような既存のフレームワークは、そのグローバル収束を示すために、ネットワークの無限幅の限界を取る必要がある。
論文 参考訳(メタデータ) (2020-07-11T18:19:50Z) - Modeling from Features: a Mean-field Framework for Over-parameterized
Deep Neural Networks [54.27962244835622]
本稿では、オーバーパラメータ化ディープニューラルネットワーク(DNN)のための新しい平均場フレームワークを提案する。
このフレームワークでは、DNNは連続的な極限におけるその特徴に対する確率測度と関数によって表現される。
本稿では、標準DNNとResidual Network(Res-Net)アーキテクチャを通してフレームワークを説明する。
論文 参考訳(メタデータ) (2020-07-03T01:37:16Z) - Rectified Linear Postsynaptic Potential Function for Backpropagation in
Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。
本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文 参考訳(メタデータ) (2020-03-26T11:13:07Z) - Approximation smooth and sparse functions by deep neural networks
without saturation [0.6396288020763143]
本稿では,スムーズかつスパースな関数を近似するために,3つの層を隠蔽したディープニューラルネットワークを構築することを目的とする。
構成したディープネットは, 滑らかかつスパースな関数を制御可能な自由パラメータで近似することで, 最適近似率に達することを証明した。
論文 参考訳(メタデータ) (2020-01-13T09:28:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。