論文の概要: Earth System Foundation Model (ESFM): A unified framework for heterogeneous data integration and forecasting
- arxiv url: http://arxiv.org/abs/2605.00850v1
- Date: Mon, 20 Apr 2026 11:40:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 06:56:26.46611
- Title: Earth System Foundation Model (ESFM): A unified framework for heterogeneous data integration and forecasting
- Title(参考訳): Earth System Foundation Model (ESFM): 異種データの統合と予測のための統合フレームワーク
- Authors: Firat Ozdemir, Yun Cheng, Salman Mohebi, Fanny Lehmann, Simon Adamov, Zhenyi Zhang, Leonardo Trentini, Dana Grund, Oliver Fuhrer, Torsten Hoefler, Siddhartha Mishra, Sebastian Schemm, Benedikt Soja, Mathieu Salzmann,
- Abstract要約: 地球系の基礎モデル(FM)は、大量のデータセットにわたる物理変数間の統計的関係を学習する。
本稿では,アース・システム・ファンデーション・モデル(ESFM)について紹介する。
本研究では,高密度グリッドデータ (ERA5, CMIP6) , 地域密集データ, 疎グリッドMODIS衛星データ, 局データを用いた。
結果は、最先端のベンチマークと比較して、競争力や優れたパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 52.53742727060265
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Foundation models (FMs) for the Earth system learn statistical relationships between physical variables across massive datasets to enable versatile downstream applications through finetuning, separating them from task-specific weather models. Here, we introduce Earth System Foundation Model (ESFM), a fully open model building on the 3D Swin UNet backbone of the pioneering Aurora model. ESFM introduces extensions that increase functionality and foster adoption in climate sciences. First, the encoding scheme and training protocols have been extended to handle diverse datasets, including those containing missing values across all spatio-temporal dimensions such as satellite data, as well as station data, all under one backbone. Axial attention is introduced to capture inter-variable dependencies. As a result ESFM skillfully predicts variables in regions or on pressure levels where no data is present at the initial time, while preserving inter-variable relationships, for example between temperature, pressure, and humidity. Individual variable tokenization enables different sets of variables to be shuffled during training and simplifies the process of building extensions for new downstream tasks. Adaptive layer norm-based ensembles allow for a simple yet effective way to transform deterministic ESFM to a probabilistic FM. We present findings using dense gridded data (ERA5, CMIP6), regionally masked dense data, sparse gridded MODIS satellite data, and station data. Results demonstrate competitive or superior performance relative to state-of-the-art benchmarks. Case studies of Super Typhoon Doksuri (2023) and 2024 sudden stratospheric warming events show accurate positional and magnitude estimations of extreme weather. ESFM retains the strengths of previous foundation models, such as long-term stability, but facilitates application to a variety of downstream tasks.
- Abstract(参考訳): 地球システムのための基礎モデル(FM)は、巨大なデータセットにわたる物理変数間の統計的関係を学習し、微調整によって汎用的な下流アプリケーションを可能にし、それらをタスク固有の気象モデルから分離する。
本稿では,アース・システム・ファンデーション・モデル(ESFM, Earth System Foundation Model)を紹介する。
ESFMは、機能性を高め、気候科学における採用を促進する拡張を導入している。
まず、符号化スキームとトレーニングプロトコルが拡張され、衛星データやステーションデータなど、すべての時空間次元の欠落を含むさまざまなデータセットを扱うようになった。
変数間の依存関係をキャプチャするために軸的注意が導入された。
その結果、ESFMは、温度、圧力、湿度などの変数間の関係を保ちながら、初期時にデータが存在しない領域や圧力レベルの変数を巧みに予測する。
個別の変数トークン化により、トレーニング中に異なる変数のセットをシャッフルすることができ、新しい下流タスク用の拡張を構築するプロセスが簡単になる。
適応層ノルムに基づくアンサンブルは、決定論的ESFMを確率的FMに変換する単純かつ効果的な方法を可能にする。
本研究では,高密度グリッドデータ (ERA5, CMIP6) , 地域密集データ, 疎グリッドMODIS衛星データ, 局データを用いた。
結果は、最先端のベンチマークと比較して、競争力や優れたパフォーマンスを示している。
超台風(2023年)と2024年の突然の成層圏温暖化現象のケーススタディは、極端な気象の正確な位置と大きさを推定している。
ESFMは、長期安定のような従来の基礎モデルの強みを保ちながら、様々な下流タスクへの適用を促進する。
関連論文リスト
- Posterior Augmented Flow Matching [64.1559809786948]
後拡張フローマッチング(PAFM)はフローマッチング(FM)の一般化である
PAFMは、異なるモデルスケールで最大3.4FID50KでFMよりも改善されていることを示す。
論文 参考訳(メタデータ) (2026-05-01T17:59:59Z) - Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Generative Data Assimilation of Sparse Weather Station Observations at Kilometer Scales [5.427841765899196]
そこで本研究では,現実的に複雑な1kmスケールの気象条件下でのスコアベースデータ同化の実現可能性を示す。
40の気象観測所からの観測を取り入れることで、左の観測所で10%低いRMSEが達成される。
ますます野心的な地域国家ジェネレータと、In situ、地上ベース、衛星リモートセンシングデータストリームの集合を組み合わす拡張を探求する時期だ。
論文 参考訳(メタデータ) (2024-06-19T10:28:11Z) - Personalized Adapter for Large Meteorology Model on Devices: Towards Weather Foundation Models [36.229082478423585]
LM-Weatherは、事前訓練された言語モデル(PLM)を使用する一般的なアプローチである
PLMに軽量なパーソナライズドアダプタを導入し、気象パターンの認識に役立てる。
実験の結果、LM-Weatherは様々なタスクにおいて最先端の結果より優れていた。
論文 参考訳(メタデータ) (2024-05-24T15:25:09Z) - Observation-Guided Meteorological Field Downscaling at Station Scale: A
Benchmark and a New Method [66.80344502790231]
気象学的ダウンスケーリングを任意の散乱ステーションスケールに拡張し、新しいベンチマークとデータセットを確立する。
データ同化技術にインスパイアされた我々は、観測データをダウンスケーリングプロセスに統合し、マルチスケールの観測先行情報を提供する。
提案手法は、複数の曲面変数上で、他の特別に設計されたベースラインモデルよりも優れている。
論文 参考訳(メタデータ) (2024-01-22T14:02:56Z) - A Spatiotemporal Deep Neural Network for Fine-Grained Multi-Horizon Wind
Prediction [3.2474405288441544]
本稿では,高精度かつ高精度な風速予測のための新しいデータ駆動モデルを提案する。
MHSTNは、シークエンス・ツー・シークエンス(Seq2Seq)バックボーンで異なる因子をターゲットにした複数のディープニューラルネットワークを統合する。
MHSTNはすでに中国で最も忙しい国際空港のスケジューリングプラットフォームに統合されている。
論文 参考訳(メタデータ) (2023-09-09T09:36:28Z) - ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。
気候データセットの自己教師型学習目標で事前トレーニングすることができる。
気候や気候の様々な問題に対処するために、微調整が可能である。
論文 参考訳(メタデータ) (2023-01-24T23:19:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。