論文の概要: AtmosMJ: Revisiting Gating Mechanism for AI Weather Forecasting Beyond the Year Scale
- arxiv url: http://arxiv.org/abs/2506.09733v1
- Date: Wed, 11 Jun 2025 13:38:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:03.012134
- Title: AtmosMJ: Revisiting Gating Mechanism for AI Weather Forecasting Beyond the Year Scale
- Title(参考訳): AtmosMJ:AI天気予報の1年を超えてゲーティングメカニズムを再考
- Authors: Minjong Cheon,
- Abstract要約: 本研究では,ERA5データを球面再マッピングなしで直接操作する深層畳み込みネットワークを提案する。
以上の結果から,AtmosMJは約500日間,安定かつ物理的に妥当な予測が得られた。
- 参考スコア(独自算出の注目度): 4.8951183832371
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advent of Large Weather Models (LWMs) has marked a turning point in data-driven forecasting, with many models now outperforming traditional numerical systems in the medium range. However, achieving stable, long-range autoregressive forecasts beyond a few weeks remains a significant challenge. Prevailing state-of-the-art models that achieve year-long stability, such as SFNO and DLWP-HPX, have relied on transforming input data onto non-standard spatial domains like spherical harmonics or HEALPix meshes. This has led to the prevailing assumption that such representations are necessary to enforce physical consistency and long-term stability. This paper challenges that assumption by investigating whether comparable long-range performance can be achieved on the standard latitude-longitude grid. We introduce AtmosMJ, a deep convolutional network that operates directly on ERA5 data without any spherical remapping. The model's stability is enabled by a novel Gated Residual Fusion (GRF) mechanism, which adaptively moderates feature updates to prevent error accumulation over long recursive simulations. Our results demonstrate that AtmosMJ produces stable and physically plausible forecasts for about 500 days. In quantitative evaluations, it achieves competitive 10-day forecast accuracy against models like Pangu-Weather and GraphCast, all while requiring a remarkably low training budget of 5.7 days on a V100 GPU. Our findings suggest that efficient architectural design, rather than non-standard data representation, can be the key to unlocking stable and computationally efficient long-range weather prediction.
- Abstract(参考訳): 大規模気象モデル(LWM)の出現は、データ駆動予測の転換点となり、多くのモデルが中規模で従来の数値システムを上回っている。
しかし、数週間を超える安定した長距離自動回帰予測を達成することは大きな課題である。
SFNOやDLWP-HPXのような1年間の安定性を達成する最先端のモデルは、入力データを球面調和やHEALPixメッシュのような非標準空間領域に変換することに頼っている。
このことは、このような表現が物理的な一貫性と長期的な安定性を強制するために必要である、という一般的な仮定につながった。
本稿では,標準緯度-経度格子上で,同等の長距離性能が達成できるかどうかを検証し,仮定に挑戦する。
本研究では,ERA5データを直接操作する深層畳み込みネットワークであるAtmosMJを紹介する。
モデルの安定性は、長期再帰シミュレーションにおけるエラーの蓄積を防ぐために、機能更新を適応的に緩和する新しいGated Residual Fusion(GRF)メカニズムによって実現されている。
以上の結果から,AtmosMJは約500日間,安定かつ物理的に妥当な予測が得られた。
定量的評価では、Pangu-WeatherやGraphCastといったモデルと競合する10日間の予測精度を実現し、V100 GPUのトレーニング予算は5.7日と極めて低い。
この結果から,非標準データ表現よりも効率的な設計が,安定かつ計算効率のよい長距離気象予測の鍵となる可能性が示唆された。
関連論文リスト
- Appa: Bending Weather Dynamics with Latent Diffusion Models for Global Data Assimilation [4.430758443755128]
Appaはスコアベースのデータ同化モデルで、地球規模の大気軌道を0.25度と1時間間隔で生成する。
この結果から,将来的な大気モデルシステムの基礎として,潜在スコアに基づくデータ同化が確立される。
論文 参考訳(メタデータ) (2025-04-25T22:14:29Z) - How far are today's time-series models from real-world weather forecasting applications? [22.68937280154092]
WEATHER-5Kは、現実世界のシナリオをよりよく反映した観測気象データの包括的収集である。
これにより、モデルのより良いトレーニングと、TSFモデルの現実の予測能力のより正確な評価が可能になる。
我々は,学術的TSFモデルと実世界の天気予報アプリケーションとのギャップを,研究者に明確に評価する。
論文 参考訳(メタデータ) (2024-06-20T15:18:52Z) - Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.13352174687475]
本稿では,天気予報をトレーニングデータセットを超える微細な時間スケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。
具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。
また、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークも導入する。
論文 参考訳(メタデータ) (2024-05-22T16:21:02Z) - FuXi-ENS: A machine learning model for medium-range ensemble weather forecasting [16.562512279873577]
我々は,最大15日間のグローバルアンサンブル天気予報を実現するために設計された,高度なMLモデルであるFuXi-ENSを紹介する。
FuXi-ENS は空間分解能が 0.25 度大きく向上し、13の圧力レベルで5つの大気変数と13の表面変数が組み込まれている。
その結果,FXi-ENSは360変数の98.1%のCRPSと予測リードタイムの組み合わせで,世界有数のNWPモデルであるECMWFのアンサンブル予測よりも優れていた。
論文 参考訳(メタデータ) (2024-05-09T17:15:09Z) - Long-term drought prediction using deep neural networks based on geospatial weather data [75.38539438000072]
農業計画や保険には1年前から予測される高品質の干ばつが不可欠だ。
私たちは、体系的なエンドツーエンドアプローチを採用するエンドツーエンドアプローチを導入することで、干ばつデータに取り組みます。
主な発見は、TransformerモデルであるEarthFormerが、正確な短期(最大6ヶ月)の予測を行う際の例外的なパフォーマンスである。
論文 参考訳(メタデータ) (2023-09-12T13:28:06Z) - Advancing Parsimonious Deep Learning Weather Prediction using the HEALPix Mesh [3.2785715577154595]
110kmのメッシュ上で最大1年間のリードタイムで,3時間分解能を持つ7つの大気変数の予測を行うため,同種の深層学習天気予報モデルを提案する。
Pangu-WeatherやGraphCastのような最先端の機械学習(SOTA)天気予報モデルと比較して、我々のDLWP-HPXモデルは粗い分解能と予測変数がはるかに少ない。
論文 参考訳(メタデータ) (2023-09-11T16:25:48Z) - Improving data-driven global weather prediction using deep convolutional
neural networks on a cubed sphere [7.918783985810551]
深層畳み込みニューラルネットワーク(CNN)を用いたデータ駆動型世界天気予報フレームワークを提案する。
このフレームワークの新しい開発には、オフラインの体積保存的マッピングから立方体球格子へのマッピングが含まれる。
我々のモデルでは、入力された大気状態の少ない変数から複雑な表面温度パターンを予測することができる。
論文 参考訳(メタデータ) (2020-03-15T19:57:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。