論文の概要: Sonny: Breaking the Compute Wall in Medium-Range Weather Forecasting
- arxiv url: http://arxiv.org/abs/2603.21284v1
- Date: Sun, 22 Mar 2026 15:15:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.328453
- Title: Sonny: Breaking the Compute Wall in Medium-Range Weather Forecasting
- Title(参考訳): ソニー:中距離の天気予報でコンピューターの壁を壊す
- Authors: Minjong Cheon,
- Abstract要約: 我々は、競争力のある中距離予測性能を実現する効率的な階層変換器であるSonnyを紹介する。
WeatherBench2では、Sonnyは堅牢な中距離予測スキルを獲得し、運用ベースラインと競合し続け、FastNetよりも明確なアドバンテージを示している。
- 参考スコア(独自算出の注目度): 3.993449663756884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Weather forecasting is a fundamental problem for protecting lives and infrastructure from high-impact atmospheric events. Recently, data-driven weather forecasting methods based on deep learning have demonstrated strong performance, often reaching accuracy levels competitive with operational numerical systems. However, many existing models rely on large-scale training regimes and compute-intensive architectures, which raises the practical barrier for academic groups with limited compute resources. Here we introduce Sonny, an efficient hierarchical transformer that achieves competitive medium-range forecasting performance while remaining feasible within reasonable compute budgets. At the core of Sonny is a two-stage StepsNet design: a narrow slow path first models large-scale atmospheric dynamics, and a subsequent full-width fast path integrates thermodynamic interactions. To stabilize medium-range rollout without an additional fine-tuning stage, we apply exponential moving average (EMA) during training. On WeatherBench2, Sonny yields robust medium-range forecast skill, remains competitive with operational baselines, and demonstrates clear advantages over FastNet, particularly at extended tropical lead times. In practice, Sonny can be trained to convergence on a single NVIDIA A40 GPU in approximately 5.5 days.
- Abstract(参考訳): 気象予報は、高影響の大気イベントから生命とインフラを保護するための根本的な問題である。
近年,深層学習に基づくデータ駆動型天気予報手法は高い性能を示し,運転数値システムと競合する精度に達している。
しかし、既存のモデルの多くは大規模な訓練体制と計算集約アーキテクチャに依存しており、計算資源が限られている学術グループにとって現実的な障壁を生じさせる。
本稿では,有効な計算予算内に留まりながら,競争力のある中距離予測性能を実現する効率的な階層変換器であるSonnyを紹介する。
狭い緩やかな経路が最初は大規模大気力学をモデル化し、続くフル幅の高速経路が熱力学的相互作用を統合する。
追加の微調整をせずに中距離ロールアウトを安定させるため,トレーニング中に指数移動平均(EMA)を適用した。
WeatherBench2では、Sonnyは堅牢な中距離予測スキルを獲得し、運用ベースラインと競合し続け、特に熱帯のリードタイムの延長において、FastNetよりも明確なアドバンテージを示している。
実際には、Sonnyは1つのNVIDIA A40 GPUに約5.5日で収束するように訓練することができる。
関連論文リスト
- EMFormer: Efficient Multi-Scale Transformer for Accumulative Context Weather Forecasting [34.793750131438934]
長期の天気予報は社会経済計画や災害に備える上で重要である。
本稿では,事前学習,微調整,予測にまたがる新しいパイプラインを提案する。
トレーニングと推論の両方において単一の畳み込みによってマルチスケール特徴を抽出する効率的なマルチスケールトランス (EMFormer) を提案する。
論文 参考訳(メタデータ) (2026-02-01T12:36:01Z) - Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.13352174687475]
本稿では,天気予報をトレーニングデータセットを超える微細な時間スケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。
具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。
また、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークも導入する。
論文 参考訳(メタデータ) (2024-05-22T16:21:02Z) - Analyzing and Exploring Training Recipes for Large-Scale Transformer-Based Weather Prediction [1.3194391758295114]
比較的オフ・ザ・シェルフアーキテクチャ、簡単な訓練手順、適度な計算予算でも高い予測能力が得られることを示す。
具体的には、ERA5データに基づいて最小修正SwinV2変換器をトレーニングし、IFSと比較すると優れた予測技術が得られることを確かめる。
論文 参考訳(メタデータ) (2024-04-30T15:30:14Z) - ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.6987191099507]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。
また,複数のランダムサンプルを用いて予測結果の不確かさをキャプチャするExBoosterについても紹介する。
提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文 参考訳(メタデータ) (2024-02-02T10:34:13Z) - Scaling transformer neural networks for skillful and reliable medium-range weather forecasting [23.249955524044392]
本稿では,標準変圧器バックボーンの変更を最小限に抑えつつ,気象予報の最先端性能であるStormerを紹介する。
Stormerの中核はランダムな予測目標であり、様々な時間間隔で天気のダイナミクスを予測するためにモデルを訓練する。
ウェザーベンチ2では、ストーマーは短距離から中距離の予測で競争力を発揮し、現在の手法を7日を超えて上回っている。
論文 参考訳(メタデータ) (2023-12-06T19:46:06Z) - Learning Robust Precipitation Forecaster by Temporal Frame Interpolation [65.5045412005064]
本研究では,空間的不一致に対するレジリエンスを示す頑健な降水予測モデルを構築した。
提案手法は,textit4cast'23コンペティションの移行学習リーダーボードにおいて,textit1位を確保したモデルにおいて,予測精度が大幅に向上した。
論文 参考訳(メタデータ) (2023-11-30T08:22:08Z) - Deep Learning for Post-Processing Ensemble Weather Forecasts [14.622977874836298]
深層ニューラルネットワークを用いた後処理ステップと組み合わせて,元来の天気トラジェクトリのサブセットのみを使用する混合モデルを提案する。
我々の後処理では,全アンサンブルに匹敵する結果を得るために,より少ないトラジェクトリを使用できることを示す。
論文 参考訳(メタデータ) (2020-05-18T14:23:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。