論文の概要: Quantitative Sobolev Approximation Bounds for Neural Operators with Empirical Validation on Burgers Equation
- arxiv url: http://arxiv.org/abs/2605.08170v1
- Date: Mon, 04 May 2026 22:15:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.419158
- Title: Quantitative Sobolev Approximation Bounds for Neural Operators with Empirical Validation on Burgers Equation
- Title(参考訳): バーガー方程式上の経験的検証を伴うニューラル演算子のソボレフ近似境界
- Authors: Nicole Hao,
- Abstract要約: 本研究では,ソボレフ空間における演算子学習のための関数解析フレームワークを開発し,それをFNO(Fourier Neural Operators)の数値的挙動に接続する。
モデルサイズの全体にわたって、テスト$H1$-errorsを$mathcalO(10-7)$まで下げ、相対誤差を10~3$とし、解と空間微分を正確に一致させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural operators have emerged as a powerful tool for learning mappings between infinite-dimensional function spaces. However, their approximation properties in Sobolev norms remain poorly quantified, even though these norms control both function values and derivatives and are the natural metrics for PDE well-posedness, stability, and generalization. We develop a functional-analytic framework for operator learning in Sobolev spaces and connect it to the numerical behavior of Fourier Neural Operators (FNOs) on a prototypical PDE. First, for a continuous nonlinear operator $\mathcal{G}: H^{s}(D)\to H^{t}(D')$ with $s > d/2$ and inputs restricted to a compact subset of $H^{s}(D)$, we prove that $\mathcal{G}$ can be uniformly approximated in $H^{t}$-norm by a neural operator with $\mathcal{O}(\varepsilon^{-d/s})$ trainable parameters. This yields an explicit complexity--error relation of the form $\|\mathcal{G}-\mathcal{G}_θ\|_{H^{t}} \lesssim C N^{-s/d}$. We then study the one-dimensional viscous Burgers solution operator $\mathcal{G}: u_{0}\mapsto u(\cdot,1)$ on a bounded $H^{1}$-ball and train FNOs with an $H^{1}$-loss. Across a sweep of model sizes, we obtain test $H^{1}$-errors down to $\mathcal{O}(10^{-7})$ and relative errors of order $10^{-3}$, with predictions accurately matching both solutions and spatial derivatives on held-out data. A log-log plot of Sobolev error versus parameter count exhibits an approximate power law $\|\mathcal{G}-\mathcal{G}_θ\|_{H^{1}} \approx C N^{-α}$ with empirical exponent $α\approx 1.4$, and long-horizon training reveals optimization instabilities in large FNOs, providing quantitative evidence that Sobolev-space approximation theory meaningfully predicts neural-operator scaling behavior.
- Abstract(参考訳): ニューラルネットワークは無限次元関数空間間の写像を学習するための強力なツールとして登場した。
しかし、それらのソボレフノルムの近似特性は、これらのノルムが関数値と微分の両方を制御し、PDEの正当性、安定性、一般化の自然な指標であるにもかかわらず、十分に定量化されていない。
本研究では,ソボレフ空間における演算子学習のための関数解析フレームワークを開発し,それをFNO(Fourier Neural Operators)の数値的挙動に接続する。
まず、連続非線形作用素 $\mathcal{G}: H^{s}(D)\to H^{t}(D')$ with $s > d/2$ および$H^{s}(D)$ のコンパクト部分集合に制限された入力に対して、$\mathcal{G}$が$\mathcal{O}(\varepsilon^{-d/s})$ トレーニング可能なパラメータを持つニューラル作用素によって$H^{t}$-normで均一に近似できることを証明する。
これにより、$\|\mathcal{G}-\mathcal{G}_θ\|_{H^{t}} \lesssim C N^{-s/d}$ という形の明示的な複雑性-エラー関係が得られる。
次に、1次元粘性バーガーズ解作用素 $\mathcal{G}: u_{0}\mapsto u(\cdot,1)$ を有界な$H^{1}$-ball 上で研究し、$H^{1}$-loss で FNOs を訓練する。
H^{1}$-errors down to $\mathcal{O}(10^{-7})$ and relative error of order 10^{-3}$, with predictions accurate matching both solution and space derivatives on held-out data。
ソボレフ誤差対パラメータカウントのログプロットは、経験的指数 $α\approx 1.4$ を持つ近似パワー則 $\|\mathcal{G}-\mathcal{G}_θ\|_{H^{1}} \approx C N^{-α}$ を示し、長い水平トレーニングは大きなFNOにおける最適化の不安定性を明らかにし、ソボレフ空間近似理論がニューラルネットワークのスケーリング挙動を有意に予測する定量的な証拠を与える。
関連論文リスト
- Expressive Power of Deep Networks on Manifolds: Simultaneous Approximation [2.815765641180636]
境界重みを持つ定数深度$mathrmReLUk-1$ネットワークは、ソボレフ空間内の任意の関数を近似することができることを示す。
また、必要なパラメータ数が対数係数に一致することを示すことで、我々の構成がほぼ最適であることを示す。
論文 参考訳(メタデータ) (2025-09-11T11:28:20Z) - Neural network learns low-dimensional polynomials with SGD near the information-theoretic limit [75.4661041626338]
単一インデックス対象関数 $f_*(boldsymbolx) = textstylesigma_*left(langleboldsymbolx,boldsymbolthetarangleright)$ の勾配勾配勾配学習問題について検討する。
SGDに基づくアルゴリズムにより最適化された2層ニューラルネットワークは、情報指数に支配されない複雑さで$f_*$を学習する。
論文 参考訳(メタデータ) (2024-06-03T17:56:58Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - A Unified Framework for Uniform Signal Recovery in Nonlinear Generative
Compressed Sensing [68.80803866919123]
非線形測定では、ほとんどの先行結果は一様ではない、すなわち、すべての$mathbfx*$に対してではなく、固定された$mathbfx*$に対して高い確率で保持される。
本フレームワークはGCSに1ビット/一様量子化観測と単一インデックスモデルを標準例として適用する。
また、指標集合が計量エントロピーが低い製品プロセスに対して、より厳密な境界を生み出す濃度不等式も開発する。
論文 参考訳(メタデータ) (2023-09-25T17:54:19Z) - Exponentially improved efficient machine learning for quantum many-body states with provable guarantees [0.0]
量子多体状態とその性質をモデル非依存の応用で効率的に学習するための理論的保証を提供する。
本結果は,量子多体状態とその特性をモデル非依存の応用で効率的に学習するための理論的保証を提供する。
論文 参考訳(メタデータ) (2023-04-10T02:22:36Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - Low-degree learning and the metric entropy of polynomials [44.99833362998488]
少なくとも$Omega(sqrtvarepsilon)2dlog n leq log mathsfM(mathscrF_n,d,|cdot|_L,varepsilon)は2辺の推定値$c(1-varepsilon)2dlogを満たす。
論文 参考訳(メタデータ) (2022-03-17T23:52:08Z) - Non-Parametric Estimation of Manifolds from Noisy Data [1.0152838128195467]
ノイズの多いサンプルの有限集合から$mathbbRD$の$d$次元部分多様体を推定する問題を検討する。
点推定では$n-frack2k + d$、接空間の推定では$n-frack-12k + d$の収束率を推定する。
論文 参考訳(メタデータ) (2021-05-11T02:29:33Z) - Agnostic Learning of a Single Neuron with Gradient Descent [92.7662890047311]
期待される正方形損失から、最も適合した単一ニューロンを学習することの問題点を考察する。
ReLUアクティベーションでは、我々の人口リスク保証は$O(mathsfOPT1/2)+epsilon$である。
ReLUアクティベーションでは、我々の人口リスク保証は$O(mathsfOPT1/2)+epsilon$である。
論文 参考訳(メタデータ) (2020-05-29T07:20:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。