論文の概要: Advantage of Deep Neural Networks for Estimating Functions with
Singularity on Hypersurfaces
- arxiv url: http://arxiv.org/abs/2011.02256v2
- Date: Tue, 8 Feb 2022 17:38:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 21:29:01.142359
- Title: Advantage of Deep Neural Networks for Estimating Functions with
Singularity on Hypersurfaces
- Title(参考訳): ハイパーサーフェス上の特異性を持つ関数推定におけるディープニューラルネットワークの利点
- Authors: Masaaki Imaizumi, Kenji Fukumizu
- Abstract要約: 我々は、ディープニューラルネットワーク(DNN)が他の標準手法よりも優れている理由を説明するために、ミニマックスレート分析を開発する。
本研究では,超曲面上の特異点を持つ非滑らか関数のクラスを推定することにより,このギャップを埋めようとしている。
- 参考スコア(独自算出の注目度): 23.21591478556582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a minimax rate analysis to describe the reason that deep neural
networks (DNNs) perform better than other standard methods. For nonparametric
regression problems, it is well known that many standard methods attain the
minimax optimal rate of estimation errors for smooth functions, and thus, it is
not straightforward to identify the theoretical advantages of DNNs. This study
tries to fill this gap by considering the estimation for a class of non-smooth
functions that have singularities on hypersurfaces. Our findings are as
follows: (i) We derive the generalization error of a DNN estimator and prove
that its convergence rate is almost optimal. (ii) We elucidate a phase diagram
of estimation problems, which describes the situations where the DNNs
outperform a general class of estimators, including kernel methods, Gaussian
process methods, and others. We additionally show that DNNs outperform harmonic
analysis based estimators. This advantage of DNNs comes from the fact that a
shape of singularity can be successfully handled by their multi-layered
structure.
- Abstract(参考訳): ディープニューラルネットワーク(dnn)が他の標準手法よりも優れた性能を発揮する理由を説明するために,ミニマックスレート解析を開発した。
非パラメトリック回帰問題に対しては、多くの標準手法が滑らかな関数に対する推定誤差の最小値まで到達できることがよく知られており、DNNの理論的優位性を特定することは容易ではない。
本研究では、超曲面上の特異点を持つ非スムース関数のクラスの推定を考慮し、このギャップを埋めようとする。
私たちの発見は以下の通りである。
i) DNN推定器の一般化誤差を導出し, 収束率がほぼ最適であることを証明した。
(ii) 推定問題の位相図を解明し,dnnがカーネル法,ガウス過程法など,一般的な推定器のクラスを上回る状況を記述する。
さらに、DNNは高調波解析に基づく推定器よりも優れていることを示す。
このDNNの利点は、特異点の形状が多層構造によってうまく処理できるという事実にある。
関連論文リスト
- Efficient kernel surrogates for neural network-based regression [0.8030359871216615]
ニューラルタンジェントカーネル(NTK)の効率的な近似である共役カーネル(CK)の性能について検討する。
CK性能がNTKよりもわずかに劣っていることを示し、特定の場合において、CK性能が優れていることを示す。
NTKの代わりにCKを使用するための理論的基盤を提供するだけでなく,DNNの精度を安価に向上するためのレシピを提案する。
論文 参考訳(メタデータ) (2023-10-28T06:41:47Z) - Benign Overfitting in Deep Neural Networks under Lazy Training [72.28294823115502]
データ分布が適切に分離された場合、DNNは分類のためのベイズ最適テスト誤差を達成できることを示す。
よりスムーズな関数との補間により、より一般化できることを示す。
論文 参考訳(メタデータ) (2023-05-30T19:37:44Z) - Implicit Stochastic Gradient Descent for Training Physics-informed
Neural Networks [51.92362217307946]
物理インフォームドニューラルネットワーク(PINN)は、前方および逆微分方程式問題の解法として効果的に実証されている。
PINNは、近似すべきターゲット関数が高周波またはマルチスケールの特徴を示す場合、トレーニング障害に閉じ込められる。
本稿では,暗黙的勾配降下法(ISGD)を用いてPINNを訓練し,トレーニングプロセスの安定性を向上させることを提案する。
論文 参考訳(メタデータ) (2023-03-03T08:17:47Z) - Learning Low Dimensional State Spaces with Overparameterized Recurrent
Neural Nets [57.06026574261203]
我々は、長期記憶をモデル化できる低次元状態空間を学習するための理論的証拠を提供する。
実験は、線形RNNと非線形RNNの両方で低次元状態空間を学習することで、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2022-10-25T14:45:15Z) - Comparative Analysis of Interval Reachability for Robust Implicit and
Feedforward Neural Networks [64.23331120621118]
我々は、暗黙的ニューラルネットワーク(INN)の堅牢性を保証するために、区間到達可能性分析を用いる。
INNは暗黙の方程式をレイヤとして使用する暗黙の学習モデルのクラスである。
提案手法は, INNに最先端の区間境界伝搬法を適用するよりも, 少なくとも, 一般的には, 有効であることを示す。
論文 参考訳(メタデータ) (2022-04-01T03:31:27Z) - Non-Asymptotic Performance Guarantees for Neural Estimation of
$\mathsf{f}$-Divergences [22.496696555768846]
統計的距離は確率分布の相似性を定量化する。
このようなデータからの距離を推定する現代的な方法は、ニューラルネットワーク(NN)による変動形態のパラメータ化と最適化に依存する。
本稿では,このトレードオフを非漸近誤差境界を用いて検討し,SDの3つの一般的な選択に焦点をあてる。
論文 参考訳(メタデータ) (2021-03-11T19:47:30Z) - Fast Learning of Graph Neural Networks with Guaranteed Generalizability:
One-hidden-layer Case [93.37576644429578]
グラフニューラルネットワーク(GNN)は、グラフ構造化データから実際に学習する上で、近年大きな進歩を遂げている。
回帰問題と二項分類問題の両方に隠れ層を持つGNNの理論的に基底的な一般化可能性解析を行う。
論文 参考訳(メタデータ) (2020-06-25T00:45:52Z) - Optimization and Generalization Analysis of Transduction through
Gradient Boosting and Application to Multi-scale Graph Neural Networks [60.22494363676747]
現在のグラフニューラルネットワーク(GNN)は、オーバースムーシング(over-smoothing)と呼ばれる問題のため、自分自身を深くするのは難しいことが知られている。
マルチスケールGNNは、オーバースムーシング問題を緩和するための有望なアプローチである。
マルチスケールGNNを含むトランスダクティブ学習アルゴリズムの最適化と一般化を保証する。
論文 参考訳(メタデータ) (2020-06-15T17:06:17Z) - Nonconvex sparse regularization for deep neural networks and its
optimality [1.9798034349981162]
ディープニューラルネットワーク(DNN)推定器は、回帰と分類問題に対して最適な収束率を得ることができる。
スパースDNNに対する新たなペナル化推定法を提案する。
スパースペンタライズされた推定器は、様々な非パラメトリック回帰問題に対する最小収束率を適応的に達成できることを示す。
論文 参考訳(メタデータ) (2020-03-26T07:15:28Z) - Interval Neural Networks: Uncertainty Scores [11.74565957328407]
我々は、事前訓練された深層ニューラルネットワーク(DNN)の出力における不確実性スコアを生成する高速で非ベイズ的手法を提案する。
このインターバルニューラルネットワーク(INN)は、インターバル値パラメータを持ち、インターバル演算を用いてその入力を伝搬する。
画像再構成タスクの数値実験において,予測誤差の代用としてINNの実用性を実証する。
論文 参考訳(メタデータ) (2020-03-25T18:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。