論文の概要: ThousandWorlds: A benchmark for climate emulation of potentially habitable exoplanets
- arxiv url: http://arxiv.org/abs/2606.18338v1
- Date: Tue, 16 Jun 2026 18:00:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.831784
- Title: ThousandWorlds: A benchmark for climate emulation of potentially habitable exoplanets
- Title(参考訳): thousandsWorlds: 居住可能な太陽系外惑星の気候エミュレーションのベンチマーク
- Authors: Edward T. Stevenson, Mei Ting Mak, Eric Wolf, Denis E. Sergeev, Tobi Hammond, N. J. Mayne, Miles Cranmer,
- Abstract要約: ThousandWorldsは、エクソクライムエミュレーションのためのML対応のベンチマークであり、ローデータ、マルチシミュレータ、パラメータ・ツー・フィールドレグレッションのより広範なレグレッションのためのものである。
このデータセットには、5つのGCMから約1800のシミュレーションが含まれており、8つの惑星のパラメータを3D大気場にマッピングしている。
GPベースの手法が最善を尽くし、万能深層学習がまだ成功していない体制を公開することを示唆している。
- 参考スコア(独自算出の注目度): 0.07690071794879008
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The search for life beyond Earth will depend on detecting faint signatures in the atmospheres of potentially habitable exoplanets. Interpreting those signatures requires understanding the host planet's climate: the same molecule may signal life on one planet and abiotic chemistry on another. Global climate models (GCMs) provide this understanding, but individual runs can require up to millions of core-hours and substantial domain expert time. Machine-learning emulators could remove this bottleneck, but progress has been limited by the absence of a curated, multi-model exoclimate dataset. We introduce ThousandWorlds, an ML-ready benchmark for exoclimate emulation and for the broader regime of low-data, multi-simulator, parameter-to-field regression. The dataset contains approximately 1800 simulations from five GCMs, mapping eight planet parameters to 3D atmospheric fields including temperature, humidity, winds, clouds, and radiation. Three nested subsets define progressively harder challenges: single-simulator regression, multi-simulator regression with complete observations, and multi-simulator regression with structured missingness. We propose two evaluation protocols: one for ranking methods, and one that measures performance relative to the disagreement between GCMs themselves. We evaluate seven baselines spanning simple methods, deep learning, and Gaussian processes. GP-based methods perform best, suggesting that ThousandWorlds exposes a regime where off-the-shelf deep learning does not yet succeed. Data: https://doi.org/10.57967/hf/8695. Code: https://github.com/edstevenson/ThousandWorlds.
- Abstract(参考訳): 地球外生命の探索は、居住可能な太陽系外惑星の大気中のかすかなシグネチャを検出することに依存する。
これらの記号を解釈するには、宿主の惑星の気候を理解する必要がある。
グローバル気候モデル(GCM)はこの理解を提供するが、個々の実行には数百万コア時間と相当なドメインエキスパート時間が必要になる。
機械学習エミュレータは、このボトルネックを取り除くことができるが、キュレートされたマルチモデルエクソ気候データセットがないため、進歩は制限されている。
我々は、エクソクライムエミュレーションのためのML対応ベンチマークであるSagaWorldsを導入し、低データ、マルチシミュレータ、パラメータ・ツー・フィールドレグレッションのより広範なレグレッションについて検討した。
このデータセットには、5つのGCMから約1800のシミュレーションが含まれており、8つの惑星のパラメータを温度、湿度、風、雲、放射など3Dの大気場にマッピングしている。
3つのネストされたサブセットは、シングルシミュレータの回帰、完全な観察を伴うマルチシミュレータの回帰、構造化された欠如を伴うマルチシミュレータの回帰という、徐々に難しい課題を定義している。
本稿では,2つの評価プロトコルを提案する。1つはランク付け手法で,もう1つはGCM自体の相違に対して性能を測る手法である。
簡単な手法,深層学習,ガウス過程にまたがる7つのベースラインを評価する。
GPベースの手法が最善を尽くし、万能深層学習がまだ成功していない体制を公開することを示唆している。
データ:https://doi.org/10.57967/hf/8695。
コード:https://github.com/edstevenson/ThousandWorlds。
関連論文リスト
- SamudrACE: Fast and Accurate Coupled Climate Modeling with 3D Ocean and Atmosphere Emulators [6.297785124293287]
SamudrACEは、水平1度、大気6時間、海洋5日の分解能で何世紀にもわたってシミュレーションを制作している。
高度に安定しており、その成分に匹敵する気候バイアスが低い。
論文 参考訳(メタデータ) (2025-09-15T22:27:26Z) - The impact of internal variability on benchmarking deep learning climate emulators [2.3342885570554652]
完全複雑地球系モデル(ESM)は計算に非常に高価であり、複数の放出経路の気候結果の探索に使用を制限している。
ESMを近似したより効率的なエミュレータは、排出ガスを直接気候の結果にマッピングすることができ、ベンチマークを使用して標準化されたタスクやデータセットの精度を評価する。
我々は、データ駆動型気候エミュレーションの一般的なベンチマークであるClimateBenchを調査し、ディープラーニングベースのエミュレータが現在、最高のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-08-09T18:17:17Z) - ClimSim-Online: A Large Multi-scale Dataset and Framework for Hybrid ML-physics Climate Emulation [45.201929285600606]
我々は、ハイブリッドML物理シミュレータを開発するためのエンドツーエンドワークフローを含むClimSim-Onlineを提案する。
データセットはグローバルで、高いサンプリング頻度で10年間にわたっています。
MLモデルを運用環境シミュレータに統合するための、クロスプラットフォームでコンテナ化されたパイプラインを提供します。
論文 参考訳(メタデータ) (2023-06-14T21:26:31Z) - ClimART: A Benchmark Dataset for Emulating Atmospheric Radiative
Transfer in Weather and Climate Models [13.514499533538789]
我々はClimARTという大規模なデータセットを構築し、現在の、工業以前の、将来の気候条件から、カナダ地球系モデルに基づいて、Emph10万以上のサンプルを収集した。
ClimARTは、複数のアウト・オブ・ディストリビューションテストセット、基礎となるドメイン物理学、精度と推論速度のトレードオフなど、MLコミュニティにいくつかの方法論上の課題を提起している。
また、以前の作業で使用されるデータセットとネットワークアーキテクチャの欠点を示す新しいベースラインをいくつか提示する。
論文 参考訳(メタデータ) (2021-11-29T16:32:31Z) - DeepClimGAN: A High-Resolution Climate Data Generator [60.59639064716545]
地球系モデル(ESM)は、気候変動シナリオの将来の予測を生成するためにしばしば用いられる。
妥協として、エミュレータはかなり安価であるが、ESMの複雑さを全て備えているわけではない。
本稿では, ESMエミュレータとして, 条件付き生成逆数ネットワーク(GAN)の使用を実証する。
論文 参考訳(メタデータ) (2020-11-23T20:13:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。