論文の概要: Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition
- arxiv url: http://arxiv.org/abs/2511.20963v3
- Date: Mon, 01 Dec 2025 03:00:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 15:37:38.337846
- Title: Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition
- Title(参考訳): フロンティアのクラウドソーシング:50,000ドルのKaggleコンペティションを通じてハイブリッド物理-ML気候シミュレーションを促進する
- Authors: Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard,
- Abstract要約: サブグリッド機械学習(ML)パラメータ化は、新しい世代の気候モデルを導入する可能性がある。
しかし、オンラインの不安定性から一貫性のないオンラインのパフォーマンスに至るまで、重要な問題は、長期の気候予測において運用上の使用を制限している。
本稿では,優勝チームのアーキテクチャにインスパイアされたエミュレータを対話型気候モデルに結合することで,Kaggleコンペティションのダウンストリーム結果について報告する。
- 参考スコア(独自算出の注目度): 4.969400527070207
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Subgrid machine-learning (ML) parameterizations have the potential to introduce a new generation of climate models that incorporate the effects of higher-resolution physics without incurring the prohibitive computational cost associated with more explicit physics-based simulations. However, important issues, ranging from online instability to inconsistent online performance, have limited their operational use for long-term climate projections. To more rapidly drive progress in solving these issues, domain scientists and machine learning researchers opened up the offline aspect of this problem to the broader machine learning and data science community with the release of ClimSim, a NeurIPS Datasets and Benchmarks publication, and an associated Kaggle competition. This paper reports on the downstream results of the Kaggle competition by coupling emulators inspired by the winning teams' architectures to an interactive climate model (including full cloud microphysics, a regime historically prone to online instability) and systematically evaluating their online performance. Our results demonstrate that online stability in the low-resolution, real-geography setting is reproducible across multiple diverse architectures, which we consider a key milestone. All tested architectures exhibit strikingly similar offline and online biases, though their responses to architecture-agnostic design choices (e.g., expanding the list of input variables) can differ significantly. Multiple Kaggle-inspired architectures achieve state-of-the-art (SOTA) results on certain metrics such as zonal mean bias patterns and global RMSE, indicating that crowdsourcing the essence of the offline problem is one path to improving online performance in hybrid physics-AI climate simulation.
- Abstract(参考訳): サブグリッド機械学習(ML)パラメータ化(英語版)は、より明示的な物理学に基づくシミュレーションに関連する計算コストを課すことなく、高解像度物理学の効果を取り入れた新しい世代の気候モデルを導入する可能性がある。
しかしながら、オンラインの不安定性から一貫性のないオンラインのパフォーマンスに至るまで、重要な問題は、長期の気候予測において運用上の使用を制限している。
これらの問題を解決するために、ドメイン科学者と機械学習研究者は、この問題のオフライン的な側面を、より広範な機械学習とデータサイエンスコミュニティに開放した。
本稿では、優勝チームのアーキテクチャにインスパイアされたエミュレータをインタラクティブな気候モデル(フルクラウドのマイクロフィジカル、歴史的にはオンラインの不安定性が高い)に結合し、オンラインのパフォーマンスを体系的に評価することで、Kaggleコンペティションのダウンストリーム結果について報告する。
その結果、低解像度でリアルな地形設定におけるオンラインの安定性は、多種多様なアーキテクチャで再現可能であることが示され、重要なマイルストーンであると考えられる。
テストされたすべてのアーキテクチャは、オフラインとオンラインのバイアスが著しく似ていますが、アーキテクチャに依存しない設計選択(例えば、入力変数のリストを拡大する)に対する応答は、大きく異なります。
複数のKaggleにインスパイアされたアーキテクチャは、水平平均バイアスパターンやグローバルRMSEといった特定の指標に基づいて、最先端のSOTA(State-of-the-art)を達成し、オフライン問題の本質をクラウドソーシングすることが、ハイブリッド物理とAI気候シミュレーションにおけるオンラインのパフォーマンス向上への道の1つであることを示唆している。
関連論文リスト
- World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - Navigating the Noise: Bringing Clarity to ML Parameterization Design with O(100) Ensembles [1.9199275795132604]
サブグリッドプロセスの機械学習(ML)パラメータ化は、いつか従来のパラメータ化を置き換えるかもしれない。
オフラインとオンラインのパフォーマンスの関係の不確実性は、彼らの開発を妨げる。
オフラインエラーの体系的削減がオンラインエラーやオンライン安定性の変化にどのように影響するかを示す。
論文 参考訳(メタデータ) (2023-09-28T05:34:29Z) - ClimSim-Online: A Large Multi-scale Dataset and Framework for Hybrid ML-physics Climate Emulation [45.201929285600606]
我々は、ハイブリッドML物理シミュレータを開発するためのエンドツーエンドワークフローを含むClimSim-Onlineを提案する。
データセットはグローバルで、高いサンプリング頻度で10年間にわたっています。
MLモデルを運用環境シミュレータに統合するための、クロスプラットフォームでコンテナ化されたパイプラインを提供します。
論文 参考訳(メタデータ) (2023-06-14T21:26:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。