論文の概要: QuadNorm: Resolution-Robust Normalization for Neural Operators
- arxiv url: http://arxiv.org/abs/2605.07375v1
- Date: Fri, 08 May 2026 07:30:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.887755
- Title: QuadNorm: Resolution-Robust Normalization for Neural Operators
- Title(参考訳): QuadNorm:ニューラル演算子の分解能ローバスト正規化
- Authors: Bum Jun Kim, Makoto Kawano, Yusuke Iwasawa, Yutaka Matsuo,
- Abstract要約: 正規化層における既存の一様平均化を数値的二次化(QuadNorm)とBlendQuadNorm(BlendQuadNorm)に置き換える二次正規化ファミリを導入する。
終端包含一様格子では、提案された二次モーメントは離散化全体で$O(h2)$-一貫性を持つ。
転送エラー境界は、正規化によって引き起こされるミスマッチが、解像度ギャップとネットワーク深さの両方でどのようにスケールするかを予測する。
- 参考スコア(独自算出の注目度): 41.429437803093485
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Normalization layers in neural operators usually compute statistics by uniformly averaging discrete grid values, making the normalization itself discretization-dependent and thereby a source of transfer error across different resolutions or meshes. To enable discretization robustness, we introduce a quadrature normalization family that replaces existing uniform averaging in normalization layers with numerical quadrature: QuadNorm and BlendQuadNorm. On endpoint-inclusive uniform grids, the proposed quadrature moments are $O(h^2)$-consistent across discretizations, meaning that their cross-resolution mismatch decays quadratically with grid spacing. A transfer-error bound then predicts how normalization-induced mismatch scales with both the resolution gap and network depth. The experiments show the same gap- and depth-scaling trends predicted by the transfer-error bound. On Darcy, QuadNorm delivers the best cross-resolution performance at every tested target resolution from $64^2$ to $256^2$; on real-data benchmarks, Transolver with QuadNorm achieves nearly resolution-invariant transfer. The largest gains appear on nonperiodic PDEs and nonspectral architectures, where native-resolution improvements also emerge. We also validate BlendQuadNorm, which stays close to LayerNorm behavior and serves as a conservative default for periodic FNO settings. These results identify normalization as a previously overlooked source of resolution dependence in neural operators.
- Abstract(参考訳): ニューラル演算子の正規化層は通常、離散グリッド値の均一平均化によって統計を計算し、正規化自体を離散化に依存し、したがって異なる解像度やメッシュ間での転送エラーの原因となる。
離散化ロバスト性を実現するために、正規化層における既存の一様平均化を数値的二次構造である QuadNorm と BlendQuadNorm に置き換える、二次正規化ファミリを導入する。
終端包含一様格子では、提案された二次モーメントは離散化にまたがる$O(h^2)$-consistentである。
転送エラー境界は、正規化によって引き起こされるミスマッチが、解像度ギャップとネットワーク深さの両方でどのようにスケールするかを予測する。
実験では、転送エラー境界によって予測されるギャップと深さスケーリングの傾向が同じである。
実データベンチマークでは、QuadNormを使ったTransolverは、ほぼ解像度不変の転送を実現している。
最大の利益は、非周期的なPDEや非スペクトルアーキテクチャに現れ、ネイティブ解像度の改善も現れる。
また、LayerNormの動作に近く、周期的なFNO設定の保守的なデフォルトとして機能するBlendQuadNormを検証する。
これらの結果は、ニューラル演算子における以前は見過ごされていた分解能依存の源として正規化を識別する。
関連論文リスト
- Neural network methods for two-dimensional finite-source reflector design [0.0]
本稿では,光を有限拡大源から所定の遠方界分布に変換する2次元反射体の設計の逆問題に対処する。
i) 学習した逆写像を通してソース分布をプッシュする直接変更変数損失と,(ii) ターゲット空間グリッドをソースにマップするメッシュベースの損失の2つの異なる目的関数を開発する。
論文 参考訳(メタデータ) (2026-04-02T15:45:50Z) - Analysis of Hessian Scaling for Local and Global Costs in Variational Quantum Algorithm [0.42970700836450487]
変分量子アルゴリズムにおけるヘッセンのエントリーワイズ解の定量化を行う。
ショットノイズに対してヘッセン成分を解くのに必要なサンプルの複雑さを規定する2つの異なるスケーリング機構を示す。
論文 参考訳(メタデータ) (2026-01-31T15:49:23Z) - Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。
提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文 参考訳(メタデータ) (2024-10-22T10:19:27Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - Approximation Results for Gradient Descent trained Neural Networks [0.0]
ネットワークは完全に接続された一定の深さ増加幅である。
連続カーネルエラーノルムは、滑らかな関数に必要な自然な滑らかさの仮定の下での近似を意味する。
論文 参考訳(メタデータ) (2023-09-09T18:47:55Z) - Entropy Transformer Networks: A Learning Approach via Tangent Bundle
Data Manifold [8.893886200299228]
本稿では,CNNアーキテクチャの設計における画像変換の高精度かつ高速なアプローチについて述べる。
データ多様体分布を補間する新しいエントロピーSTN(ESTN)を提案する。
挑戦的なベンチマークの実験は、提案されたESTNがコンピュータビジョンタスクの範囲で予測精度を向上させることを示している。
論文 参考訳(メタデータ) (2023-07-24T04:21:51Z) - On the Effective Number of Linear Regions in Shallow Univariate ReLU
Networks: Convergence Guarantees and Implicit Bias [50.84569563188485]
我々は、ラベルが$r$のニューロンを持つターゲットネットワークの符号によって決定されるとき、勾配流が方向収束することを示す。
我々の結果は、標本サイズによらず、幅が$tildemathcalO(r)$である、緩やかなオーバーパラメータ化をすでに維持しているかもしれない。
論文 参考訳(メタデータ) (2022-05-18T16:57:10Z) - Differentiable Gaussianization Layers for Inverse Problems Regularized by Deep Generative Models [5.439020425819001]
深部生成モデルの潜時テンソルは、反転中に所望の高次元標準ガウス分布から外れる可能性があることを示す。
提案手法は精度と整合性の観点から最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-12-07T17:53:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。