論文の概要: Deep Nonparametric Estimation of Operators between Infinite Dimensional
Spaces
- arxiv url: http://arxiv.org/abs/2201.00217v1
- Date: Sat, 1 Jan 2022 16:33:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 13:32:53.247671
- Title: Deep Nonparametric Estimation of Operators between Infinite Dimensional
Spaces
- Title(参考訳): 無限次元空間間の作用素の深度非パラメトリック推定
- Authors: Hao Liu, Haizhao Yang, Minshuo Chen, Tuo Zhao, Wenjing Liao
- Abstract要約: 本稿では、ディープニューラルネットワークを用いたリプシッツ作用素の非パラメトリック推定について検討する。
対象作用素が低次元構造を示すという仮定の下では、トレーニングサンプルサイズが大きくなるにつれて誤差は減衰する。
この結果から,演算子推定における低次元データ構造の利用による高速化が期待できる。
- 参考スコア(独自算出の注目度): 41.55700086945413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning operators between infinitely dimensional spaces is an important
learning task arising in wide applications in machine learning, imaging
science, mathematical modeling and simulations, etc. This paper studies the
nonparametric estimation of Lipschitz operators using deep neural networks.
Non-asymptotic upper bounds are derived for the generalization error of the
empirical risk minimizer over a properly chosen network class. Under the
assumption that the target operator exhibits a low dimensional structure, our
error bounds decay as the training sample size increases, with an attractive
fast rate depending on the intrinsic dimension in our estimation. Our
assumptions cover most scenarios in real applications and our results give rise
to fast rates by exploiting low dimensional structures of data in operator
estimation. We also investigate the influence of network structures (e.g.,
network width, depth, and sparsity) on the generalization error of the neural
network estimator and propose a general suggestion on the choice of network
structures to maximize the learning efficiency quantitatively.
- Abstract(参考訳): 無限次元空間間の学習演算子は、機械学習、画像科学、数学的モデリング、シミュレーションなど、幅広い応用において生じる重要な学習タスクである。
本稿では,ディープニューラルネットワークを用いたリプシッツ作用素の非パラメトリック推定について検討する。
非漸近上界は、適切に選択されたネットワーククラスに対する経験的リスク最小化器の一般化誤差のために導出される。
対象演算子が低次元構造を示すと仮定すると、トレーニングサンプルサイズが増加するにつれて誤差境界が崩壊し、推定における内在次元に依存した魅力的な高速速度が得られる。
我々の仮定は実アプリケーションにおけるほとんどのシナリオをカバーしており、演算子推定における低次元データ構造を利用して高速な速度をもたらす。
また、ニューラルネットワーク推定器の一般化誤差に対するネットワーク構造(ネットワーク幅、深さ、スパーシティなど)の影響を調査し、学習効率を定量的に最大化するためのネットワーク構造の選択に関する一般的な提案を提案する。
関連論文リスト
- Neural Scaling Laws of Deep ReLU and Deep Operator Network: A Theoretical Study [8.183509993010983]
深部演算子のネットワークにおけるニューラルネットワークのスケーリング法則をChenおよびChenスタイルアーキテクチャを用いて検討する。
我々は、その近似と一般化誤差を分析して、ニューラルネットワークのスケーリング法則を定量化する。
本結果は,演算子学習における神経スケーリング法則を部分的に説明し,その応用の理論的基盤を提供する。
論文 参考訳(メタデータ) (2024-10-01T03:06:55Z) - Efficient Training of Deep Neural Operator Networks via Randomized Sampling [0.0]
ディープオペレータネットワーク(DeepNet)は、様々な科学的・工学的応用における複雑な力学のリアルタイム予測に成功している。
本稿では,DeepONetのトレーニングを取り入れたランダムサンプリング手法を提案する。
実験の結果,訓練中にトランクネットワーク入力にランダム化を組み込むことで,DeepONetの効率性と堅牢性が向上し,複雑な物理系のモデリングにおけるフレームワークの性能向上に期待できる道筋が得られた。
論文 参考訳(メタデータ) (2024-09-20T07:18:31Z) - With Greater Distance Comes Worse Performance: On the Perspective of
Layer Utilization and Model Generalization [3.6321778403619285]
ディープニューラルネットワークの一般化は、マシンラーニングにおける主要なオープンな問題の1つだ。
初期のレイヤは一般的に、トレーニングデータとテストデータの両方のパフォーマンスに関する表現を学びます。
より深いレイヤは、トレーニングのリスクを最小限に抑え、テストや不正なラベル付けされたデータとうまく連携できない。
論文 参考訳(メタデータ) (2022-01-28T05:26:32Z) - Why Lottery Ticket Wins? A Theoretical Perspective of Sample Complexity
on Pruned Neural Networks [79.74580058178594]
目的関数の幾何学的構造を解析することにより、刈り取られたニューラルネットワークを訓練する性能を解析する。
本稿では,ニューラルネットワークモデルがプルーニングされるにつれて,一般化が保証された望ましいモデル近傍の凸領域が大きくなることを示す。
論文 参考訳(メタデータ) (2021-10-12T01:11:07Z) - A Theoretical-Empirical Approach to Estimating Sample Complexity of DNNs [11.152761263415046]
本稿では,深層ニューラルネットワーク(DNN)のトレーニングデータ量と一般化誤差のスケールについて考察する。
我々は、ディープネットワークに保持され、到達不能な容量尺度に依存しない一般化誤差の推定を導出する。
論文 参考訳(メタデータ) (2021-05-05T05:14:08Z) - A neural anisotropic view of underspecification in deep learning [60.119023683371736]
ニューラルネットが問題の未特定化を扱う方法が,データ表現に大きく依存していることを示す。
深層学習におけるアーキテクチャ的インダクティブバイアスの理解は,これらのシステムの公平性,堅牢性,一般化に対処する上で基本的であることを強調した。
論文 参考訳(メタデータ) (2021-04-29T14:31:09Z) - Analytically Tractable Inference in Deep Neural Networks [0.0]
Tractable Approximate Inference (TAGI)アルゴリズムは、浅いフルコネクテッドニューラルネットワークのバックプロパゲーションに対する実行可能でスケーラブルな代替手段であることが示された。
従来のディープニューラルネットワークアーキテクチャをトレーニングするために、TAGIがバックプロパゲーションのパフォーマンスとどのように一致するか、または上回るかを実証しています。
論文 参考訳(メタデータ) (2021-03-09T14:51:34Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Large-Scale Gradient-Free Deep Learning with Recursive Local
Representation Alignment [84.57874289554839]
大規模データセット上でディープニューラルネットワークをトレーニングするには、重要なハードウェアリソースが必要である。
これらのネットワークをトレーニングするためのワークホースであるバックプロパゲーションは、本質的に並列化が難しいシーケンシャルなプロセスである。
本稿では、深層ネットワークのトレーニングに使用できるバックプロップに代わる、神経生物学的に有望な代替手段を提案する。
論文 参考訳(メタデータ) (2020-02-10T16:20:02Z) - Understanding Generalization in Deep Learning via Tensor Methods [53.808840694241]
圧縮の観点から,ネットワークアーキテクチャと一般化可能性の関係について理解を深める。
本稿では、ニューラルネットワークの圧縮性と一般化性を強く特徴付ける、直感的で、データ依存的で、測定が容易な一連の特性を提案する。
論文 参考訳(メタデータ) (2020-01-14T22:26:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。