論文の概要: AtmosMJ: Revisiting Gating Mechanism for AI Weather Forecasting Beyond the Year Scale
- arxiv url: http://arxiv.org/abs/2506.09733v2
- Date: Wed, 06 Aug 2025 03:40:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 17:55:57.567273
- Title: AtmosMJ: Revisiting Gating Mechanism for AI Weather Forecasting Beyond the Year Scale
- Title(参考訳): AtmosMJ:AI天気予報の1年を超えてゲーティングメカニズムを再考
- Authors: Minjong Cheon,
- Abstract要約: 本研究では,ERA5データを球面再マッピングなしで直接操作する深層畳み込みネットワークを提案する。
以上の結果から,AtmosMJは約500日間,安定かつ物理的に妥当な予測が得られた。
- 参考スコア(独自算出の注目度): 4.8951183832371
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advent of Large Weather Models (LWMs) has marked a turning point in data-driven forecasting, with many models now outperforming traditional numerical systems in the medium range. However, achieving stable, long-range autoregressive forecasts beyond a few weeks remains a significant challenge. Prevailing state-of-the-art models that achieve year-long stability, such as SFNO and DLWP-HPX, have relied on transforming input data onto non-standard spatial domains like spherical harmonics or HEALPix meshes. This has led to the prevailing assumption that such representations are necessary to enforce physical consistency and long-term stability. This paper challenges that assumption by investigating whether comparable long-range performance can be achieved on the standard latitude-longitude grid. We introduce AtmosMJ, a deep convolutional network that operates directly on ERA5 data without any spherical remapping. The model's stability is enabled by a novel Gated Residual Fusion (GRF) mechanism, which adaptively moderates feature updates to prevent error accumulation over long recursive simulations. Our results demonstrate that AtmosMJ produces stable and physically plausible forecasts for about 500 days. In quantitative evaluations, it achieves competitive 10-day forecast accuracy against models like Pangu-Weather and GraphCast, all while requiring a remarkably low training budget of 5.7 days on a V100 GPU. Our findings suggest that efficient architectural design, rather than non-standard data representation, can be the key to unlocking stable and computationally efficient long-range weather prediction.
- Abstract(参考訳): 大規模気象モデル(LWM)の出現は、データ駆動予測の転換点となり、多くのモデルが中規模で従来の数値システムを上回っている。
しかし、数週間を超える安定した長距離自動回帰予測を達成することは大きな課題である。
SFNOやDLWP-HPXのような1年間の安定性を達成する最先端のモデルは、入力データを球面調和やHEALPixメッシュのような非標準空間領域に変換することに頼っている。
このことは、このような表現が物理的な一貫性と長期的な安定性を強制するために必要である、という一般的な仮定につながった。
本稿では,標準緯度-経度格子上で,同等の長距離性能が達成できるかどうかを検証し,仮定に挑戦する。
本研究では,ERA5データを直接操作する深層畳み込みネットワークであるAtmosMJを紹介する。
モデルの安定性は、長期再帰シミュレーションにおけるエラーの蓄積を防ぐために、機能更新を適応的に緩和する新しいGated Residual Fusion(GRF)メカニズムによって実現されている。
以上の結果から,AtmosMJは約500日間,安定かつ物理的に妥当な予測が得られた。
定量的評価では、Pangu-WeatherやGraphCastといったモデルと競合する10日間の予測精度を実現し、V100 GPUのトレーニング予算は5.7日と極めて低い。
この結果から,非標準データ表現よりも効率的な設計が,安定かつ計算効率のよい長距離気象予測の鍵となる可能性が示唆された。
関連論文リスト
- Exploring Design Choices for Autoregressive Deep Learning Climate Models [2.401696775092447]
本研究では,ERA5再解析データに基づく3つのDL-MWPアーキテクチャの長期安定性を5.625degで定量的に比較した。
参照データセットの統計特性を保存しながら,安定した10年間のロールアウトを可能にする構成を同定する。
論文 参考訳(メタデータ) (2025-05-05T09:37:58Z) - Appa: Bending Weather Dynamics with Latent Diffusion Models for Global Data Assimilation [4.430758443755128]
Appaはスコアベースのデータ同化モデルで、地球規模の大気軌道を0.25度と1時間間隔で生成する。
この結果から,将来的な大気モデルシステムの基礎として,潜在スコアに基づくデータ同化が確立される。
論文 参考訳(メタデータ) (2025-04-25T22:14:29Z) - How far are today's time-series models from real-world weather forecasting applications? [22.68937280154092]
WEATHER-5Kは、現実世界のシナリオをよりよく反映した観測気象データの包括的収集である。
これにより、モデルのより良いトレーニングと、TSFモデルの現実の予測能力のより正確な評価が可能になる。
我々は,学術的TSFモデルと実世界の天気予報アプリケーションとのギャップを,研究者に明確に評価する。
論文 参考訳(メタデータ) (2024-06-20T15:18:52Z) - Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.13352174687475]
本稿では,天気予報をトレーニングデータセットを超える微細な時間スケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。
具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。
また、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークも導入する。
論文 参考訳(メタデータ) (2024-05-22T16:21:02Z) - CaFA: Global Weather Forecasting with Factorized Attention on Sphere [7.687215328455751]
本稿では, この問題を緩和するために, 球面測地に適した因子化アテンションモデルを提案する。
提案モデルの1.5円および0-7日のリードタイムにおける決定論的予測精度は、最先端のデータ駆動型機械学習天気予報モデルと同等である。
論文 参考訳(メタデータ) (2024-05-12T23:18:14Z) - FuXi-ENS: A machine learning model for medium-range ensemble weather forecasting [16.562512279873577]
我々は,最大15日間のグローバルアンサンブル天気予報を実現するために設計された,高度なMLモデルであるFuXi-ENSを紹介する。
FuXi-ENS は空間分解能が 0.25 度大きく向上し、13の圧力レベルで5つの大気変数と13の表面変数が組み込まれている。
その結果,FXi-ENSは360変数の98.1%のCRPSと予測リードタイムの組み合わせで,世界有数のNWPモデルであるECMWFのアンサンブル予測よりも優れていた。
論文 参考訳(メタデータ) (2024-05-09T17:15:09Z) - Weather Prediction with Diffusion Guided by Realistic Forecast Processes [49.07556359513563]
気象予報に拡散モデル(DM)を適用した新しい手法を提案する。
提案手法は,同一のモデリングフレームワークを用いて,直接予測と反復予測の両方を実現できる。
我々のモデルの柔軟性と制御性は、一般の気象コミュニティにとってより信頼性の高いDLシステムに力を与えます。
論文 参考訳(メタデータ) (2024-02-06T21:28:42Z) - FengWu-GHR: Learning the Kilometer-scale Medium-range Global Weather
Forecasting [56.73502043159699]
この研究は、データ駆動型世界天気予報モデルであるFengWu-GHRを、0.09$circ$水平解像度で実行した。
低解像度モデルから事前知識を継承することにより、MLベースの高解像度予測を操作するための扉を開く新しいアプローチを導入する。
2022年の天気予報は、FengWu-GHRがIFS-HRESよりも優れていることを示している。
論文 参考訳(メタデータ) (2024-01-28T13:23:25Z) - Learning Robust Precipitation Forecaster by Temporal Frame Interpolation [65.5045412005064]
本研究では,空間的不一致に対するレジリエンスを示す頑健な降水予測モデルを構築した。
提案手法は,textit4cast'23コンペティションの移行学習リーダーボードにおいて,textit1位を確保したモデルにおいて,予測精度が大幅に向上した。
論文 参考訳(メタデータ) (2023-11-30T08:22:08Z) - Long-term drought prediction using deep neural networks based on geospatial weather data [75.38539438000072]
農業計画や保険には1年前から予測される高品質の干ばつが不可欠だ。
私たちは、体系的なエンドツーエンドアプローチを採用するエンドツーエンドアプローチを導入することで、干ばつデータに取り組みます。
主な発見は、TransformerモデルであるEarthFormerが、正確な短期(最大6ヶ月)の予測を行う際の例外的なパフォーマンスである。
論文 参考訳(メタデータ) (2023-09-12T13:28:06Z) - Advancing Parsimonious Deep Learning Weather Prediction using the HEALPix Mesh [3.2785715577154595]
110kmのメッシュ上で最大1年間のリードタイムで,3時間分解能を持つ7つの大気変数の予測を行うため,同種の深層学習天気予報モデルを提案する。
Pangu-WeatherやGraphCastのような最先端の機械学習(SOTA)天気予報モデルと比較して、我々のDLWP-HPXモデルは粗い分解能と予測変数がはるかに少ない。
論文 参考訳(メタデータ) (2023-09-11T16:25:48Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Improving data-driven global weather prediction using deep convolutional
neural networks on a cubed sphere [7.918783985810551]
深層畳み込みニューラルネットワーク(CNN)を用いたデータ駆動型世界天気予報フレームワークを提案する。
このフレームワークの新しい開発には、オフラインの体積保存的マッピングから立方体球格子へのマッピングが含まれる。
我々のモデルでは、入力された大気状態の少ない変数から複雑な表面温度パターンを予測することができる。
論文 参考訳(メタデータ) (2020-03-15T19:57:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。