論文の概要: Probabilistic measures afford fair comparisons of AIWP and NWP model output
- arxiv url: http://arxiv.org/abs/2506.03744v1
- Date: Wed, 04 Jun 2025 09:14:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:14.254506
- Title: Probabilistic measures afford fair comparisons of AIWP and NWP model output
- Title(参考訳): 確率的測度はAIWPとNWPモデル出力の公正比較を与える
- Authors: Tilmann Gneiting, Tobias Biegert, Kristof Kraus, Eva-Maria Walz, Alexander I. Jordan, Sebastian Lerch,
- Abstract要約: 我々はAIWPモデルとNWPモデルからの単値出力の公平かつ有意義な比較のための新しい尺度を提案する。
我々はPCを,処理後の確率予測における平均連続的ランク付け確率スコア(CRPS)とみなす。
提案手法では,損失関数の事前特定が競合相手を不平等な足場に配置する設定において,単一値予測の比較を行う。
- 参考スコア(独自算出の注目度): 37.69303106863453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a new measure for fair and meaningful comparisons of single-valued output from artificial intelligence based weather prediction (AIWP) and numerical weather prediction (NWP) models, called potential continuous ranked probability score (PC). In a nutshell, we subject the deterministic backbone of physics-based and data-driven models post hoc to the same statistical postprocessing technique, namely, isotonic distributional regression (IDR). Then we find PC as the mean continuous ranked probability score (CRPS) of the postprocessed probabilistic forecasts. The nonnegative PC measure quantifies potential predictive performance and is invariant under strictly increasing transformations of the model output. PC attains its most desirable value of zero if, and only if, the weather outcome Y is a fixed, non-decreasing function of the model output X. The PC measure is recorded in the unit of the outcome, has an upper bound of one half times the mean absolute difference between outcomes, and serves as a proxy for the mean CRPS of real-time, operational probabilistic products. When applied to WeatherBench 2 data, our approach demonstrates that the data-driven GraphCast model outperforms the leading, physics-based European Centre for Medium Range Weather Forecasts (ECMWF) high-resolution (HRES) model. Furthermore, the PC measure for the HRES model aligns exceptionally well with the mean CRPS of the operational ECMWF ensemble. Across application domains, our approach affords comparisons of single-valued forecasts in settings where the pre-specification of a loss function -- which is the usual, and principally superior, procedure in forecast contests, administrative, and benchmarks settings -- places competitors on unequal footings.
- Abstract(参考訳): 本稿では,人工知能に基づく天気予報(AIWP)と数値気象予報(NWP)モデルから得られる1値の出力を,有意かつ有意義に比較するための新しい尺度を提案する。
一言で言えば、物理学に基づく決定論的バックボーンとデータ駆動型モデルのホック後の決定論的バックボーンを、同じ統計的ポストプロセッシング技術、すなわち等速分布回帰(IDR)に適用する。
次に,PC を処理後の確率予測における平均連続的ランク付け確率スコア (CRPS) とみなす。
非負のPC測度は潜在的な予測性能を定量化し、モデル出力の厳密に増加する変換の下で不変である。
PC測度は、結果の単位に記録され、結果間の平均絶対差の半倍の上限を持ち、リアルタイムで運用可能な確率的製品の平均CRPSのプロキシとして機能する。
WeatherBench 2データに適用すると、データ駆動型GraphCastモデルが、物理を基盤としたECMWF(European Centre for Medium Range Weather Forecasts)の高分解能(HRES)モデルよりも優れていることが示される。
さらに,HRESモデルのPC測度は,動作中のECMWFアンサンブルの平均CRPSと極めてよく一致している。
アプリケーション領域全体では、損失関数の事前特定 -- 予測コンテスト、管理、ベンチマーク設定における手順 -- が、競争相手を不平等な足場に置くような環境で、単値予測の比較を行うことができる。
関連論文リスト
- Post-processing improves accuracy of Artificial Intelligence weather forecasts [0.14043931310479374]
我々は,気象局の統計後処理システムIMPROVERをECMWFの決定論的AIFSに適用することをテストする。
我々はAIFSとNWPモデルを組み合わせることで、AIFS単独が最も正確なコンポーネントではない場合でも、全体的な予測スキルが向上することを示した。
論文 参考訳(メタデータ) (2025-04-17T06:05:10Z) - On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - Improving probabilistic forecasts of extreme wind speeds by training statistical post-processing models with weighted scoring rules [0.0]
閾値重み付き連続ランク確率スコア(twCRPS)を用いたトレーニングは、後処理モデルの極端なイベント性能を向上させる。
極端事象の確率論的予測の性能が向上し,分布物体の予測性能が低下する分布体テールトレードオフが発見された。
論文 参考訳(メタデータ) (2024-07-22T11:07:52Z) - ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.6987191099507]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。
また,複数のランダムサンプルを用いて予測結果の不確かさをキャプチャするExBoosterについても紹介する。
提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文 参考訳(メタデータ) (2024-02-02T10:34:13Z) - A Practical Probabilistic Benchmark for AI Weather Models [0.7978324349017066]
我々は、GraphCastとPanguの2つの主要なAI天気モデルが確率論的CRPSメトリクスに結びついていることを示す。
また、多くのデータ駆動気象モデルが採用している複数の時間-ステップ損失関数が、非生産的であることも明らかにした。
論文 参考訳(メタデータ) (2024-01-27T05:53:16Z) - When Rigidity Hurts: Soft Consistency Regularization for Probabilistic
Hierarchical Time Series Forecasting [69.30930115236228]
確率的階層的時系列予測は時系列予測の重要な変種である。
ほとんどの手法は点予測に焦点を絞っており、確率的確率分布を十分に調整していない。
ProFHiTは,階層全体の予測分布を共同でモデル化する完全確率的階層予測モデルである。
論文 参考訳(メタデータ) (2023-10-17T20:30:16Z) - Generative ensemble deep learning severe weather prediction from a
deterministic convection-allowing model [0.0]
コンボリューション・ニューラル・ネットワーク(CNN)とコンボリューション・コンボリューション・アロイング・モデル(CAM)予測を併用する。
CGANは決定論的CAM予測から合成アンサンブルメンバーを作成するように設計されている。
この手法は,BSS(Brier Skill Score)を最大20%の精度で予測できる。
論文 参考訳(メタデータ) (2023-10-09T18:02:11Z) - SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models [13.331224394143117]
不確かさの定量化は意思決定に不可欠である。
天気予報の不確実性を表す主要なアプローチは、予測の集合を生成することです。
本稿では,これらの予測を歴史的データから学習した深部生成拡散モデルを用いてエミュレートし,計算コストを補正することを提案する。
論文 参考訳(メタデータ) (2023-06-24T22:00:06Z) - When in Doubt: Neural Non-Parametric Uncertainty Quantification for
Epidemic Forecasting [70.54920804222031]
既存の予測モデルは不確実な定量化を無視し、誤校正予測をもたらす。
不確実性を考慮した時系列予測のためのディープニューラルネットワークの最近の研究にもいくつかの制限がある。
本稿では,予測タスクを確率的生成過程としてモデル化し,EPIFNPと呼ばれる機能的ニューラルプロセスモデルを提案する。
論文 参考訳(メタデータ) (2021-06-07T18:31:47Z) - Probabilistic Gradient Boosting Machines for Large-Scale Probabilistic
Regression [51.770998056563094]
PGBM(Probabilistic Gradient Boosting Machines)は、確率的予測を生成する手法である。
既存の最先端手法と比較してPGBMの利点を実証的に示す。
論文 参考訳(メタデータ) (2021-06-03T08:32:13Z) - A framework for probabilistic weather forecast post-processing across
models and lead times using machine learning [3.1542695050861544]
我々はNWPモデルと意思決定支援の「理想的な」予測とのギャップを埋める方法について述べる。
本研究では,各数値モデルの誤差プロファイルの学習にQuantile Regression Forestsを使用し,これを経験から得られた確率分布を予測に適用する。
第2に、これらの確率予測を量子平均化(quantile averaging)を用いて組み合わせ、第3に、集合量子化の間で補間して完全な予測分布を生成する。
論文 参考訳(メタデータ) (2020-05-06T16:46:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。