論文の概要: Taking the Garbage Out of Data-Driven Prediction Across Climate Timescales
- arxiv url: http://arxiv.org/abs/2508.07062v1
- Date: Sat, 09 Aug 2025 17:55:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.679527
- Title: Taking the Garbage Out of Data-Driven Prediction Across Climate Timescales
- Title(参考訳): 温暖化に伴うデータ駆動予測のガベージアウト
- Authors: Jason C. Furtado, Maria J. Molina, Marybeth C. Arcodia, Weston Anderson, Tom Beucler, John A. Callahan, Laura M. Ciasto, Vittorio A. Gensini, Michelle L'Heureux, Kathleen Pegion, Jhayron S. Pérez-Carrasquilla, Maike Sonnewald, Ken Takahashi, Baoqiang Xiang, Brian G. Zimmerman,
- Abstract要約: 気候予測のために設計されたAI/MLモデルの入力データの適切な前処理のためのプロトコルを確立する。
事前処理が気候予測に与える影響について、研究者、開発者、エンドユーザを教育すること。
最終的に、推奨プラクティスを実装することで、気候予測研究におけるAI/MLの堅牢性と透明性が向上する。
- 参考スコア(独自算出の注目度): 0.3032942517187112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial intelligence (AI) -- and specifically machine learning (ML) -- applications for climate prediction across timescales are proliferating quickly. The emergence of these methods prompts a revisit to the impact of data preprocessing, a topic familiar to the climate community, as more traditional statistical models work with relatively small sample sizes. Indeed, the skill and confidence in the forecasts produced by data-driven models are directly influenced by the quality of the datasets and how they are treated during model development, thus yielding the colloquialism "garbage in, garbage out." As such, this article establishes protocols for the proper preprocessing of input data for AI/ML models designed for climate prediction (i.e., subseasonal to decadal and longer). The three aims are to: (1) educate researchers, developers, and end users on the effects that preprocessing has on climate predictions; (2) provide recommended practices for data preprocessing for such applications; and (3) empower end users to decipher whether the models they are using are properly designed for their objectives. Specific topics covered in this article include the creation of (standardized) anomalies, dealing with non-stationarity and the spatiotemporally correlated nature of climate data, and handling of extreme values and variables with potentially complex distributions. Case studies will illustrate how using different preprocessing techniques can produce different predictions from the same model, which can create confusion and decrease confidence in the overall process. Ultimately, implementing the recommended practices set forth in this article will enhance the robustness and transparency of AI/ML in climate prediction studies.
- Abstract(参考訳): 人工知能(AI) -- 特に機械学習(ML) -- は、時間スケールを越えた気候予測の応用が急速に増加している。
これらの手法の出現は、より伝統的な統計モデルが比較的小さなサンプルサイズで動作するため、気候社会に精通したトピックであるデータ前処理の影響を再考するきっかけとなる。
実際、データ駆動モデルが生み出す予測のスキルと信頼性は、データセットの品質とモデル開発中にどのように扱われるかに直接的な影響を受けており、「ガーベージ・イン・ガベージ・アウト」という口語主義を生み出している。
このように、気候予測のために設計されたAI/MLモデルの入力データの適切な前処理のためのプロトコルを確立する。
本研究の目的は,(1)事前処理が気候予測に与える影響について研究者,開発者,エンドユーザーを教育すること,(2)データ前処理の推奨プラクティスを提供すること,(3)利用者が使用するモデルが目的のために適切に設計されているかどうかを判断できるようにすることである。
この記事では、(標準化された)異常の生成、非定常性と時空間的に相関した気候データの性質の扱い、潜在的に複雑な分布を持つ極端な値と変数の扱いについて論じる。
ケーススタディでは、異なる前処理技術を使用することで、同じモデルから異なる予測が生まれ、それによって混乱が生じ、プロセス全体の信頼性が低下することを示した。
最終的に、この記事で推奨されるプラクティスを実装することで、気候予測研究におけるAI/MLの堅牢性と透明性が向上する。
関連論文リスト
- Data-driven Seasonal Climate Predictions via Variational Inference and Transformers [31.98107454758077]
我々は季節予測のための気候モデル出力の生成モデルを訓練する。
気候変動に伴う傾向を超えた年次異常予測における手法の性能分析を行った。
論文 参考訳(メタデータ) (2025-03-26T11:51:23Z) - Generative assimilation and prediction for weather and climate [9.319028023682494]
GAP(Generative Assimilation and Prediction)を紹介する。
GAPは気候と気候の同化と予測のための統合された枠組みである。
データ同化、シームレスな予測、気候シミュレーションなど、幅広い気候関連タスクに優れています。
論文 参考訳(メタデータ) (2025-03-04T22:36:29Z) - On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.6987191099507]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。
また,複数のランダムサンプルを用いて予測結果の不確かさをキャプチャするExBoosterについても紹介する。
提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文 参考訳(メタデータ) (2024-02-02T10:34:13Z) - Towards an end-to-end artificial intelligence driven global weather forecasting system [57.5191940978886]
我々は,地球規模の気象変動に対するAIに基づくデータ同化モデル,すなわちAdasを提案する。
我々は,アダスが地球観測を同化して高品質な分析を行い,長期にわたって安定して運用できることを実証した。
この手法を現実のシナリオに適用するのは,私たちが初めてです。
論文 参考訳(メタデータ) (2023-12-18T09:05:28Z) - Predicting Temperature of Major Cities Using Machine Learning and Deep
Learning [0.0]
我々は,大都市における気温変化を構成するデイトン大学が作成したデータベースを用いて,将来いつでも異なる都市の気温を予測する。
この文書には、このような予測を行うための方法論が含まれています。
論文 参考訳(メタデータ) (2023-09-23T10:23:00Z) - SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models [13.331224394143117]
不確かさの定量化は意思決定に不可欠である。
天気予報の不確実性を表す主要なアプローチは、予測の集合を生成することです。
本稿では,これらの予測を歴史的データから学習した深部生成拡散モデルを用いてエミュレートし,計算コストを補正することを提案する。
論文 参考訳(メタデータ) (2023-06-24T22:00:06Z) - ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。
気候データセットの自己教師型学習目標で事前トレーニングすることができる。
気候や気候の様々な問題に対処するために、微調整が可能である。
論文 参考訳(メタデータ) (2023-01-24T23:19:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。