論文の概要: Probabilistic measures afford fair comparisons of AIWP and NWP model output
- arxiv url: http://arxiv.org/abs/2506.03744v1
- Date: Wed, 04 Jun 2025 09:14:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:14.254506
- Title: Probabilistic measures afford fair comparisons of AIWP and NWP model output
- Title(参考訳): 確率的測度はAIWPとNWPモデル出力の公正比較を与える
- Authors: Tilmann Gneiting, Tobias Biegert, Kristof Kraus, Eva-Maria Walz, Alexander I. Jordan, Sebastian Lerch,
- Abstract要約: 我々はAIWPモデルとNWPモデルからの単値出力の公平かつ有意義な比較のための新しい尺度を提案する。
我々はPCを,処理後の確率予測における平均連続的ランク付け確率スコア(CRPS)とみなす。
提案手法では,損失関数の事前特定が競合相手を不平等な足場に配置する設定において,単一値予測の比較を行う。
- 参考スコア(独自算出の注目度): 37.69303106863453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a new measure for fair and meaningful comparisons of single-valued output from artificial intelligence based weather prediction (AIWP) and numerical weather prediction (NWP) models, called potential continuous ranked probability score (PC). In a nutshell, we subject the deterministic backbone of physics-based and data-driven models post hoc to the same statistical postprocessing technique, namely, isotonic distributional regression (IDR). Then we find PC as the mean continuous ranked probability score (CRPS) of the postprocessed probabilistic forecasts. The nonnegative PC measure quantifies potential predictive performance and is invariant under strictly increasing transformations of the model output. PC attains its most desirable value of zero if, and only if, the weather outcome Y is a fixed, non-decreasing function of the model output X. The PC measure is recorded in the unit of the outcome, has an upper bound of one half times the mean absolute difference between outcomes, and serves as a proxy for the mean CRPS of real-time, operational probabilistic products. When applied to WeatherBench 2 data, our approach demonstrates that the data-driven GraphCast model outperforms the leading, physics-based European Centre for Medium Range Weather Forecasts (ECMWF) high-resolution (HRES) model. Furthermore, the PC measure for the HRES model aligns exceptionally well with the mean CRPS of the operational ECMWF ensemble. Across application domains, our approach affords comparisons of single-valued forecasts in settings where the pre-specification of a loss function -- which is the usual, and principally superior, procedure in forecast contests, administrative, and benchmarks settings -- places competitors on unequal footings.
- Abstract(参考訳): 本稿では,人工知能に基づく天気予報(AIWP)と数値気象予報(NWP)モデルから得られる1値の出力を,有意かつ有意義に比較するための新しい尺度を提案する。
一言で言えば、物理学に基づく決定論的バックボーンとデータ駆動型モデルのホック後の決定論的バックボーンを、同じ統計的ポストプロセッシング技術、すなわち等速分布回帰(IDR)に適用する。
次に,PC を処理後の確率予測における平均連続的ランク付け確率スコア (CRPS) とみなす。
非負のPC測度は潜在的な予測性能を定量化し、モデル出力の厳密に増加する変換の下で不変である。
PC測度は、結果の単位に記録され、結果間の平均絶対差の半倍の上限を持ち、リアルタイムで運用可能な確率的製品の平均CRPSのプロキシとして機能する。
WeatherBench 2データに適用すると、データ駆動型GraphCastモデルが、物理を基盤としたECMWF(European Centre for Medium Range Weather Forecasts)の高分解能(HRES)モデルよりも優れていることが示される。
さらに,HRESモデルのPC測度は,動作中のECMWFアンサンブルの平均CRPSと極めてよく一致している。
アプリケーション領域全体では、損失関数の事前特定 -- 予測コンテスト、管理、ベンチマーク設定における手順 -- が、競争相手を不平等な足場に置くような環境で、単値予測の比較を行うことができる。
関連論文リスト
- Improving probabilistic forecasts of extreme wind speeds by training statistical post-processing models with weighted scoring rules [0.0]
閾値重み付き連続ランク確率スコア(twCRPS)を用いたトレーニングは、後処理モデルの極端なイベント性能を向上させる。
極端事象の確率論的予測の性能が向上し,分布物体の予測性能が低下する分布体テールトレードオフが発見された。
論文 参考訳(メタデータ) (2024-07-22T11:07:52Z) - ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.6987191099507]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。
また,複数のランダムサンプルを用いて予測結果の不確かさをキャプチャするExBoosterについても紹介する。
提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文 参考訳(メタデータ) (2024-02-02T10:34:13Z) - A Practical Probabilistic Benchmark for AI Weather Models [0.7978324349017066]
我々は、GraphCastとPanguの2つの主要なAI天気モデルが確率論的CRPSメトリクスに結びついていることを示す。
また、多くのデータ駆動気象モデルが採用している複数の時間-ステップ損失関数が、非生産的であることも明らかにした。
論文 参考訳(メタデータ) (2024-01-27T05:53:16Z) - SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models [13.331224394143117]
不確かさの定量化は意思決定に不可欠である。
天気予報の不確実性を表す主要なアプローチは、予測の集合を生成することです。
本稿では,これらの予測を歴史的データから学習した深部生成拡散モデルを用いてエミュレートし,計算コストを補正することを提案する。
論文 参考訳(メタデータ) (2023-06-24T22:00:06Z) - Probabilistic Gradient Boosting Machines for Large-Scale Probabilistic
Regression [51.770998056563094]
PGBM(Probabilistic Gradient Boosting Machines)は、確率的予測を生成する手法である。
既存の最先端手法と比較してPGBMの利点を実証的に示す。
論文 参考訳(メタデータ) (2021-06-03T08:32:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。