論文の概要: Efficient fine-tuning of 37-level GraphCast with the Canadian global deterministic analysis
- arxiv url: http://arxiv.org/abs/2408.14587v1
- Date: Mon, 26 Aug 2024 19:16:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-28 17:40:47.405996
- Title: Efficient fine-tuning of 37-level GraphCast with the Canadian global deterministic analysis
- Title(参考訳): カナダのグローバル決定論的分析による37レベルグラフCastの効率的な微調整
- Authors: Christopher Subich,
- Abstract要約: この研究は、グラフCastデータ駆動予測モデルを効率的に微調整し、別の分析システムをシミュレートするプロセスを記述する。
結果として得られたモデルは、未修正のGraphCastと運用予測の両方を著しく上回る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work describes a process for efficiently fine-tuning the GraphCast data-driven forecast model to simulate another analysis system, here the Global Deterministic Prediction System (GDPS) of Environment and Climate Change Canada (ECCC). Using two years of training data (July 2019 -- December 2021) and 37 GPU-days of computation to tune the 37-level, quarter-degree version of GraphCast, the resulting model significantly outperforms both the unmodified GraphCast and operational forecast, showing significant forecast skill in the troposphere over lead times from 1 to 10 days. This fine-tuning is accomplished through abbreviating DeepMind's original training curriculum for GraphCast, relying on a shorter single-step forecast stage to accomplish the bulk of the adaptation work and consolidating the autoregressive stages into separate 12hr, 1d, 2d, and 3d stages with larger learning rates. Additionally, training over 3d forecasts is split into two sub-steps to conserve host memory while maintaining a strong correlation with training over the full period.
- Abstract(参考訳): 本研究は, 別の分析システムをシミュレートするために, GraphCastデータ駆動予測モデルを効率的に微調整するプロセスについて述べる。
2年間のトレーニングデータ(2019年7月~2021年12月)と37GPU日の計算データを使って、37レベルの4分の1のGraphCastをチューニングし、結果として得られたモデルは、修正されていないGraphCastと運用予測の両方を著しく上回り、1日から10日間のリードタイムにおける対流圏のかなりの予測スキルを示している。
この微調整は、DeepMindによるGraphCastのトレーニングカリキュラムを省略し、短い単一ステップの予測ステージを使用して、適応作業の大部分を達成し、自動回帰ステージを12hr、1d、2d、3dステージに集約することで実現される。
さらに、3d予測のトレーニングを2つのサブステップに分割してホストメモリを保存し、フル期間のトレーニングと強い相関を維持する。
関連論文リスト
- VEDIT: Latent Prediction Architecture For Procedural Video Representation Learning [59.68917139718813]
そこで本研究では,市販の冷凍型ビジュアルエンコーダを用いて,予測および手続き計画において,最先端(SoTA)の性能を達成可能であることを示す。
観察されたステップから凍結したクリップレベルの埋め込みを条件付けて、目に見えないステップの動作を予測することで、予測のための堅牢な表現を学習することができる。
論文 参考訳(メタデータ) (2024-10-04T14:52:09Z) - EWMoE: An effective model for global weather forecasting with mixture-of-experts [6.695845790670147]
本研究では,地球規模の天気予報に有効なモデルであるEWMoEを提案する。
本モデルは,3次元絶対位置埋め込み,Mixture-of-Experts層,および2つの特定の損失関数の3つの重要な要素を組み込んで予測精度を向上させる。
論文 参考訳(メタデータ) (2024-05-09T16:42:13Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Advancing Parsimonious Deep Learning Weather Prediction using the HEALPix Mesh [3.2785715577154595]
110kmのメッシュ上で最大1年間のリードタイムで,3時間分解能を持つ7つの大気変数の予測を行うため,同種の深層学習天気予報モデルを提案する。
Pangu-WeatherやGraphCastのような最先端の機械学習(SOTA)天気予報モデルと比較して、我々のDLWP-HPXモデルは粗い分解能と予測変数がはるかに少ない。
論文 参考訳(メタデータ) (2023-09-11T16:25:48Z) - Deep Learning for Day Forecasts from Sparse Observations [60.041805328514876]
深層ニューラルネットワークは、気象条件をモデル化するための代替パラダイムを提供する。
MetNet-3は、密度とスパースの両方のデータセンサーから学習し、降水、風、温度、露点を最大24時間前に予測する。
MetNet-3は、それぞれ時間分解能と空間分解能が高く、最大2分と1km、運用遅延は低い。
論文 参考訳(メタデータ) (2023-06-06T07:07:54Z) - GraphCast: Learning skillful medium-range global weather forecasting [107.40054095223779]
我々は、再分析データから直接トレーニングできる「GraphCast」と呼ばれる機械学習ベースの手法を導入する。
全世界で10日以上、0.25度で、数百の気象変動を1分以内で予測する。
我々は,GraphCastが1380の検証対象の90%において,最も正確な運用決定システムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-24T18:15:39Z) - Pangu-Weather: A 3D High-Resolution Model for Fast and Accurate Global
Weather Forecast [91.9372563527801]
我々は,世界天気予報を迅速かつ高精度に予測するためのディープラーニングベースのシステムであるPangu-Weatherを紹介する。
初めてAIベースの手法が、最先端の数値天気予報法(NWP)を精度で上回った。
Pangu-Weatherは、極端な天気予報や大規模なアンサンブル予測など、幅広い下流予測シナリオをサポートしている。
論文 参考訳(メタデータ) (2022-11-03T17:19:43Z) - Temporal Action Localization with Multi-temporal Scales [54.69057924183867]
マルチ時間スケールの特徴空間における行動を予測することを提案する。
具体的には、異なるスケールの洗練された特徴ピラミッドを使用して、高レベルのスケールから低レベルのスケールにセマンティクスを渡す。
提案手法は, それぞれ12.6%, 17.4%, 2.2%の改善を達成できる。
論文 参考訳(メタデータ) (2022-08-16T01:48:23Z) - Sub-seasonal forecasting with a large ensemble of deep-learning weather
prediction models [6.882042556551611]
深層学習天気予報(DLWP)モデルを用いたアンサンブル予測システムを提案する。
このモデルは、立方体球格子上の畳み込みニューラルネットワーク(CNN)を用いて、グローバルな予測を生成する。
エンサンブルスプレッドは、主に32のDLWPモデルを作成するためにCNNトレーニングプロセスのランダム化によって生成される。
論文 参考訳(メタデータ) (2021-02-09T20:14:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。