論文の概要: The Challenges of the Nonlinear Regime for Physics-Informed Neural Networks
- arxiv url: http://arxiv.org/abs/2402.03864v2
- Date: Wed, 26 Jun 2024 13:05:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-27 19:14:34.034583
- Title: The Challenges of the Nonlinear Regime for Physics-Informed Neural Networks
- Title(参考訳): 物理インフォームドニューラルネットワークにおける非線形レジームの課題
- Authors: Andrea Bonfanti, Giuseppe Bruno, Cristina Cipriani,
- Abstract要約: 非線形シナリオではNTKの視点が不足していることを示す。
線形および非線形の両方の場合において,そのような手法の収束保証について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Neural Tangent Kernel (NTK) viewpoint is widely employed to analyze the training dynamics of overparameterized Physics-Informed Neural Networks (PINNs). However, unlike the case of linear Partial Differential Equations (PDEs), we show how the NTK perspective falls short in the nonlinear scenario. Specifically, we establish that the NTK yields a random matrix at initialization that is not constant during training, contrary to conventional belief. Another significant difference from the linear regime is that, even in the idealistic infinite-width limit, the Hessian does not vanish and hence it cannot be disregarded during training. This motivates the adoption of second-order optimization methods. We explore the convergence guarantees of such methods in both linear and nonlinear cases, addressing challenges such as spectral bias and slow convergence. Every theoretical result is supported by numerical examples with both linear and nonlinear PDEs, and we highlight the benefits of second-order methods in benchmark test cases.
- Abstract(参考訳): The Neural Tangent Kernel (NTK) perspective is widely used to analyze the training dynamics of overparameterized Physics-Informed Neural Networks (PINNs)。
しかし、線形偏微分方程式(PDE)とは異なり、非線形シナリオにおいてNTKパースペクティブが不足することを示す。
具体的には、NTKは、従来の信念とは対照的に、トレーニング中に一定ではない初期化時にランダムな行列を生成する。
線型系との大きな違いは、理想主義的な無限幅極限でさえ、ヘッセンは消滅せず、したがって訓練中は無視できないことである。
これは二階最適化法の採用を動機付けている。
線形および非線形の場合においても,そのような手法の収束保証について検討し,スペクトルバイアスや緩やかな収束といった課題に対処する。
各理論結果は線形PDEと非線形PDEの数値例によって支持され、ベンチマークテストケースにおける2次手法の利点を強調した。
関連論文リスト
- Controlled Learning of Pointwise Nonlinearities in Neural-Network-Like Architectures [14.93489065234423]
本稿では,階層型計算アーキテクチャにおける自由形式非線形性のトレーニングのための一般的な変分フレームワークを提案する。
傾斜制約により、1-Lipschitz安定性、堅固な非膨張性、単調性/可逆性といった特性を課すことができる。
本稿では, 非線形性を適切な(一様でない)B-スプラインベースで表現することで, 数値関数最適化問題の解法を示す。
論文 参考訳(メタデータ) (2024-08-23T14:39:27Z) - Quantum Algorithms for Nonlinear Dynamics: Revisiting Carleman Linearization with No Dissipative Conditions [0.7373617024876725]
非線形力学系をカルマン線形化法により線形常微分方程式(ODE)に埋め込む方法について検討する。
本分析は,従来の散逸状態を超えて誤差境界を探索することによって,これらの知見を拡張した。
我々は、この共振条件がカールマン線型化のトランケーションレベル$N$に対して線型収束をもたらすことを証明した。
論文 参考訳(メタデータ) (2024-05-21T12:09:34Z) - Learning Discretized Neural Networks under Ricci Flow [51.36292559262042]
低精度重みとアクティベーションからなる離散ニューラルネットワーク(DNN)について検討する。
DNNは、訓練中に微分不可能な離散関数のために無限あるいはゼロの勾配に悩まされる。
論文 参考訳(メタデータ) (2023-02-07T10:51:53Z) - Learning Low Dimensional State Spaces with Overparameterized Recurrent
Neural Nets [57.06026574261203]
我々は、長期記憶をモデル化できる低次元状態空間を学習するための理論的証拠を提供する。
実験は、線形RNNと非線形RNNの両方で低次元状態空間を学習することで、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2022-10-25T14:45:15Z) - Neural Ordinary Differential Equations for Nonlinear System
Identification [0.9864260997723973]
本研究では,NODEの性能をニューラル状態空間モデルと古典線形システム同定法と比較する。
実験の結果,NODEはベンチマーク手法に比べて精度を桁違いに向上できることがわかった。
論文 参考訳(メタデータ) (2022-02-28T22:25:53Z) - On Convergence of Training Loss Without Reaching Stationary Points [62.41370821014218]
ニューラルネットワークの重み変数は、損失関数の勾配が消える定常点に収束しないことを示す。
エルゴード理論の力学系に基づく新しい視点を提案する。
論文 参考訳(メタデータ) (2021-10-12T18:12:23Z) - Learning Nonlinear Waves in Plasmon-induced Transparency [0.0]
プラズモン誘起透過性メタマテリアルシステムにおける非線形ソリトンの複雑な伝播を予測するためのリカレントニューラルネットワーク(RNN)アプローチを検討する。
我々は,長期記憶(LSTM)人工ニューラルネットワークによるシミュレーションと予測において,結果の顕著な一致を証明した。
論文 参考訳(メタデータ) (2021-07-31T21:21:44Z) - Inverse Problem of Nonlinear Schr\"odinger Equation as Learning of
Convolutional Neural Network [5.676923179244324]
提案手法を用いて,パラメータの相対的精度を推定できることを示す。
深い学習を伴う偏微分方程式の逆問題における自然な枠組みを提供する。
論文 参考訳(メタデータ) (2021-07-19T02:54:37Z) - LQF: Linear Quadratic Fine-Tuning [114.3840147070712]
本稿では,非線形微調整に匹敵する性能を実現する事前学習モデルの線形化手法を提案する。
LQFはアーキテクチャの単純な変更、損失関数、そして一般的に分類に使用される最適化で構成されている。
論文 参考訳(メタデータ) (2020-12-21T06:40:20Z) - Learning Fast Approximations of Sparse Nonlinear Regression [50.00693981886832]
本研究では,Threshold Learned Iterative Shrinkage Algorithming (NLISTA)を導入することでギャップを埋める。
合成データを用いた実験は理論結果と相関し,その手法が最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-10-26T11:31:08Z) - A Generalized Neural Tangent Kernel Analysis for Two-layer Neural
Networks [87.23360438947114]
重み劣化を伴う雑音勾配降下は依然として「カーネル様」の挙動を示すことを示す。
これは、トレーニング損失が一定の精度まで線形に収束することを意味する。
また,重み劣化を伴う雑音勾配勾配勾配で学習した2層ニューラルネットワークに対して,新しい一般化誤差を確立する。
論文 参考訳(メタデータ) (2020-02-10T18:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。