論文の概要: ClimateSet: A Large-Scale Climate Model Dataset for Machine Learning
- arxiv url: http://arxiv.org/abs/2311.03721v1
- Date: Tue, 7 Nov 2023 04:55:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-08 16:49:06.967328
- Title: ClimateSet: A Large-Scale Climate Model Dataset for Machine Learning
- Title(参考訳): ClimateSet: 機械学習のための大規模気候モデルデータセット
- Authors: Julia Kaltenborn, Charlotte E. E. Lange, Venkatesh Ramesh, Philippe
Brouillard, Yaniv Gurwicz, Chandni Nagda, Jakob Runge, Peer Nowack and David
Rolnick
- Abstract要約: 気候モデルは、気候変動の影響を評価し、将来の気候シナリオをシミュレートするための鍵となっている。
機械学習(ML)コミュニティは、気候モデルエミュレーション、ダウンスケーリング、予測タスクといった様々なタスクにおける気候科学者の取り組みを支援することへの関心が高まっている。
ここでは、入力4MIPとCMIP6アーカイブから36の気候モデルの入力と出力を含むデータセットであるClimateSetを紹介する。
- 参考スコア(独自算出の注目度): 26.151056828513962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Climate models have been key for assessing the impact of climate change and
simulating future climate scenarios. The machine learning (ML) community has
taken an increased interest in supporting climate scientists' efforts on
various tasks such as climate model emulation, downscaling, and prediction
tasks. Many of those tasks have been addressed on datasets created with single
climate models. However, both the climate science and ML communities have
suggested that to address those tasks at scale, we need large, consistent, and
ML-ready climate model datasets. Here, we introduce ClimateSet, a dataset
containing the inputs and outputs of 36 climate models from the Input4MIPs and
CMIP6 archives. In addition, we provide a modular dataset pipeline for
retrieving and preprocessing additional climate models and scenarios. We
showcase the potential of our dataset by using it as a benchmark for ML-based
climate model emulation. We gain new insights about the performance and
generalization capabilities of the different ML models by analyzing their
performance across different climate models. Furthermore, the dataset can be
used to train an ML emulator on several climate models instead of just one.
Such a "super emulator" can quickly project new climate change scenarios,
complementing existing scenarios already provided to policymakers. We believe
ClimateSet will create the basis needed for the ML community to tackle
climate-related tasks at scale.
- Abstract(参考訳): 気候モデルは、気候変動の影響を評価し、将来の気候シナリオをシミュレートするための鍵となっている。
機械学習(ML)コミュニティは、気候モデルエミュレーション、ダウンスケーリング、予測タスクといった様々なタスクにおける気候科学者の取り組みを支援することへの関心が高まっている。
これらのタスクの多くは、単一の気候モデルで作成されたデータセットに対処されている。
しかし、気候科学とMLコミュニティの両方が、これらのタスクを大規模に対処するには、大規模で一貫性があり、ML対応の気候モデルデータセットが必要であることを示唆している。
本稿では,インプット4mipsおよびcmip6アーカイブからの36の気候モデルの入力と出力を含むデータセットであるclimatesetを紹介する。
さらに、追加の気候モデルとシナリオを検索および前処理するためのモジュラーデータセットパイプラインも提供しています。
我々は、MLベースの気候モデルエミュレーションのベンチマークとしてこれを用いてデータセットの可能性を示す。
我々は、異なる気候モデルにまたがるパフォーマンスを分析することにより、異なるMLモデルのパフォーマンスと一般化能力に関する新たな洞察を得る。
さらに、データセットを使用して、MLエミュレータを複数の気候モデル上でトレーニングすることも可能だ。
このような「スーパーエミュレータ」は、政策立案者に提供された既存のシナリオを補完する、新しい気候変動シナリオを迅速に計画することができる。
climatesetは、mlコミュニティが大規模に気候関連のタスクに取り組むために必要な基盤を作ると信じています。
関連論文リスト
- Probabilistic Emulation of a Global Climate Model with Spherical DYffusion [15.460280166612119]
本稿では,地球規模の気候アンサンブルシミュレーションを作成できる最初の条件生成モデルについて述べる。
われわれのアプローチは、関連する基準を破り、気候モデルエミュレーションを成功させるための金の基準にほぼ達している。
論文 参考訳(メタデータ) (2024-06-21T00:16:55Z) - Aurora: A Foundation Model of the Atmosphere [56.97266186291677]
我々はAuroraを紹介します。Auroraは、100万時間以上の多様な気象および気候データに基づいてトレーニングされた大気の大規模な基礎モデルです。
オーロラは1分以内に5日間の大気汚染予測と10日間の高解像度気象予測を生み出している。
論文 参考訳(メタデータ) (2024-05-20T14:45:18Z) - Comparing Data-Driven and Mechanistic Models for Predicting Phenology in
Deciduous Broadleaf Forests [47.285748922842444]
我々は、気象時系列から表現指標を予測するために、ディープニューラルネットワークを訓練する。
このアプローチは従来のプロセスベースのモデルよりも優れています。
論文 参考訳(メタデータ) (2024-01-08T15:29:23Z) - Arabic Mini-ClimateGPT : A Climate Change and Sustainability Tailored
Arabic LLM [77.17254959695218]
ChatGPTやBardのような大規模言語モデル(LLM)は、優れた会話能力を示し、幅広いNLPタスクに優れています。
我々は,オープンソースのLLM上に構築され,アラビア語データセットClima500-Instructの対話型命令チューニングに特化して微調整された軽量のアラビア語ミニクリメートGPTを提案する。
本モデルは,ChatGPTによる評価において,88.3%の症例において,ベースラインLLMを上回った。
論文 参考訳(メタデータ) (2023-12-14T22:04:07Z) - Towards Causal Representations of Climate Model Data [18.82507552857727]
この研究は因果表現学習の可能性、特に単一パーセンシャル・デコーディング(CDSD)法によるemphCausal Discoveryの可能性を掘り下げるものである。
以上の結果から,CDSDをより解釈可能で堅牢な気候モデルエミュレーションへのステップストーンとして使用するという課題,限界,約束が明らかになった。
論文 参考訳(メタデータ) (2023-12-05T16:13:34Z) - ClimateLearn: Benchmarking Machine Learning for Weather and Climate
Modeling [20.63843548201849]
ClimateLearnは、データ駆動型気候科学のための機械学習モデルのトレーニングと評価を大幅に単純化する、オープンソースのライブラリである。
これは、現代の機械学習システムによる気象と気候モデリングの研究をブリッジする、最初の大規模かつオープンソースな取り組みである。
論文 参考訳(メタデータ) (2023-07-04T20:36:01Z) - ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。
気候データセットの自己教師型学習目標で事前トレーニングすることができる。
気候や気候の様々な問題に対処するために、微調整が可能である。
論文 参考訳(メタデータ) (2023-01-24T23:19:01Z) - Spatiotemporal modeling of European paleoclimate using doubly sparse
Gaussian processes [61.31361524229248]
計算負担を軽減するため,近年の大規模分散時間GPを構築した。
我々は,古気候の確率モデルを構築するために,この2倍のスパースGPをうまく利用した。
論文 参考訳(メタデータ) (2022-11-15T14:15:04Z) - Climate-Invariant Machine Learning [0.8831201550856289]
現在の気候モデルは、モデルグリッドサイズよりも小さなスケールで発生するプロセスの表現を必要とする。
最近の機械学習(ML)アルゴリズムは、そのようなプロセス表現を改善することを約束するが、訓練されていない気候体制に悪影響を及ぼす傾向がある。
我々は、気候プロセスの知識をMLアルゴリズムに取り入れた「気候不変」MLと呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-14T07:02:57Z) - DeepClimGAN: A High-Resolution Climate Data Generator [60.59639064716545]
地球系モデル(ESM)は、気候変動シナリオの将来の予測を生成するためにしばしば用いられる。
妥協として、エミュレータはかなり安価であるが、ESMの複雑さを全て備えているわけではない。
本稿では, ESMエミュレータとして, 条件付き生成逆数ネットワーク(GAN)の使用を実証する。
論文 参考訳(メタデータ) (2020-11-23T20:13:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。