論文の概要: The Recipe Matters More Than the Kitchen:Mathematical Foundations of the AI Weather Prediction Pipeline
- arxiv url: http://arxiv.org/abs/2604.01215v1
- Date: Wed, 01 Apr 2026 17:53:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.13614
- Title: The Recipe Matters More Than the Kitchen:Mathematical Foundations of the AI Weather Prediction Pipeline
- Title(参考訳): キッチンよりもレシピが重要:AI天気予報パイプラインの数学的基礎
- Authors: Piyush Garg, Diana R. Gergel, Andrew E. Shao, Galen J. Yacalis,
- Abstract要約: 本研究では,球面,力学系理論,情報理論,統計的学習理論の近似理論に根ざした枠組みを構築した。
推定誤差が近似誤差を支配していることを示す学習パイプライン誤り分解を構築した。
NVIDIA Earth2Studioを用いて、アーキテクチャ的に多様な10のAI気象モデルを対象とした推論により、これらの予測を検証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI weather prediction has advanced rapidly, yet no unified mathematical framework explains what determines forecast skill. Existing theory addresses specific architectural choices rather than the learning pipeline as a whole, while operational evidence from 2023-2026 demonstrates that training methodology, loss function design, and data diversity matter at least as much as architecture selection. This paper makes two interleaved contributions. Theoretically, we construct a framework rooted in approximation theory on the sphere, dynamical systems theory, information theory, and statistical learning theory that treats the complete learning pipeline (architecture, loss function, training strategy, data distribution) rather than architecture alone. We establish a Learning Pipeline Error Decomposition showing that estimation error (loss- and data-dependent) dominates approximation error (architecture-dependent) at current scales. We develop a Loss Function Spectral Theory formalizing MSE-induced spectral blurring in spherical harmonic coordinates, and derive Out-of-Distribution Extrapolation Bounds proving that data-driven models systematically underestimate record-breaking extremes with bias growing linearly in record exceedance. Empirically, we validate these predictions via inference across ten architecturally diverse AI weather models using NVIDIA Earth2Studio with ERA5 initial conditions, evaluating six metrics across 30 initialization dates spanning all seasons. Results confirm universal spectral energy loss at high wavenumbers for MSE-trained models, rising Error Consensus Ratios showing that the majority of forecast error is shared across architectures, and linear negative bias during extreme events. A Holistic Model Assessment Score provides unified multi-dimensional evaluation, and a prescriptive framework enables mathematical evaluation of proposed pipelines before training.
- Abstract(参考訳): AI天気予報は急速に進歩しているが、予測スキルを決定するものを説明する統一された数学的枠組みは存在しない。
既存の理論は、学習パイプライン全体よりも、特定のアーキテクチャ選択に対処する一方で、2023-2026の運用証拠は、トレーニング方法論、損失関数設計、データ多様性が少なくともアーキテクチャ選択と同じくらい重要であることを実証している。
本論文は2つのインターリーブ・コントリビューションを行う。
理論的には、アーキテクチャのみではなく、完全な学習パイプライン(アーキテクチャ、損失関数、トレーニング戦略、データ分散)を扱う球体、力学系理論、情報理論、統計学習理論の近似理論に根ざしたフレームワークを構築する。
我々は、推定誤差(ロスおよびデータ依存)が近似誤差(アーキテクチャ依存)を現在のスケールで支配していることを示す学習パイプラインエラー分解を確立する。
我々は,MSEによる球面調和座標のスペクトルのぼかしを定式化したロス関数スペクトル理論を開発し,データ駆動型モデルが記録超過で線形にバイアスが増加することを証明したアウト・オブ・ディストリビューション外挿境界を導出した。
ERA5初期条件付きNVIDIA Earth2Studioを用いて、アーキテクチャ的に多様性のある10のAI気象モデルを対象とした推論により、これらの予測を実証し、季節毎に30の初期化日を6つのメトリクスで評価する。
その結果,MSE訓練モデルの高波数での普遍的なスペクトルエネルギー損失が確認され,予測誤差の大部分がアーキテクチャ間で共有され,極端事象時の線形負バイアスが示される。
ホロスティックモデルアセスメントスコアは、統合された多次元評価を提供し、規範的なフレームワークは、トレーニング前に提案されたパイプラインの数学的評価を可能にする。
関連論文リスト
- Demystifying Data-Driven Probabilistic Medium-Range Weather Forecasting [63.8116386935854]
最先端の確率的スキルは、複雑なアーキテクチャ制約や専門的な訓練を必要としないことを実証する。
直下型遅延空間と履歴条件付きローカルプロジェクタを組み合わせることで,マルチスケールの大気力学を学習するためのスケーラブルなフレームワークを提案する。
我々のフレームワーク設計は確率的推定器の選択に頑健であり、補間、拡散モデル、CRPSに基づくアンサンブルトレーニングをシームレスにサポートする。
論文 参考訳(メタデータ) (2026-01-26T03:52:16Z) - Bridging the Gap Between Bayesian Deep Learning and Ensemble Weather Forecasts [100.26854618129039]
天気予報は、大気のカオス的な性質によって根本的に挑戦されている。
ベイジアンディープラーニング(BDL)の最近の進歩は、有望だがしばしば非接続な代替手段を提供する。
気象予報のための統合型BDLフレームワークにより,これらのパラダイムを橋渡しする。
論文 参考訳(メタデータ) (2025-11-18T07:49:52Z) - Temporal Difference Flows [82.24174052059352]
Geometric Horizon Models (GHMs) は、将来の状態を直接予測することで、魅力的な代替手段を提供する。
既存の手法は、列車時のブートストラップ予測や、長い地平線で高品質な予測を生成するのに苦慮している。
本稿では,従来の手法の水平長の5倍以上の精度で正確なGHMを学習するために,確率経路上の新しいベルマン方程式の構造を利用した時間差流(TD-Flow)を提案する。
論文 参考訳(メタデータ) (2025-03-12T20:30:07Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - From Reactive to Proactive Volatility Modeling with Hemisphere Neural Networks [0.0]
我々は,新しいニューラルネットワークアーキテクチャを用いて,マクロ経済密度予測のための最大推定値(MLE)を再活性化する。
ヘミスフィアニューラルネットワーク(HNN)は、可能時の主指標に基づく積極的なボラティリティ予測と、必要時の過去の予測誤差の大きさに基づく反応性ボラティリティ予測を提供する。
論文 参考訳(メタデータ) (2023-11-27T21:37:50Z) - Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - Temporal Subsampling Diminishes Small Spatial Scales in Recurrent Neural
Network Emulators of Geophysical Turbulence [0.0]
しばしば見過ごされる処理ステップがエミュレータの予測品質にどのように影響するかを検討する。
1)空間ベクトル自己回帰(NVAR)の形式、(2)エコー状態ネットワーク(ESN)の形式。
いずれの場合も、トレーニングデータのサブサンプリングは、数値拡散に類似した小さなスケールでのバイアスの増加につながる。
論文 参考訳(メタデータ) (2023-04-28T21:34:53Z) - Probabilistic forecasting for geosteering in fluvial successions using a
generative adversarial network [0.0]
リアルタイムデータに基づく高速更新は、プレドリルモデルで高い不確実性を持つ複雑な貯水池での掘削に不可欠である。
本稿では, フラビアル継承の地質学的に一貫した2次元断面を再現するためのGAN(generative adversarial Deep Neural Network)を提案する。
この手法は不確実性を低減し, 掘削ビットより500m先にある主要な地質特性を正確に予測する。
論文 参考訳(メタデータ) (2022-07-04T12:52:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。