論文の概要: Fixing the Pitfalls of Probabilistic Time-Series Forecasting Evaluation by Kernel Quadrature
- arxiv url: http://arxiv.org/abs/2503.06079v1
- Date: Sat, 08 Mar 2025 06:01:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:52:11.703098
- Title: Fixing the Pitfalls of Probabilistic Time-Series Forecasting Evaluation by Kernel Quadrature
- Title(参考訳): カーネル四分法による確率的時系列予測の落とし穴の修正
- Authors: Masaki Adachi, Masahiro Fujisawa, Michael A Osborne,
- Abstract要約: 最も広く使われている測度である連続ランク確率スコア(CRPS)は、厳密に適切なスコア関数である。
CRPS推定器に固有の推定バイアスが認められた。
本稿では,非バイアスのCRPS推定器を活用するカーネル・クアチュア・アプローチを導入し,計算のスケーラブル化にキュキュア構成を用いる。
- 参考スコア(独自算出の注目度): 19.742371911023774
- License:
- Abstract: Despite the significance of probabilistic time-series forecasting models, their evaluation metrics often involve intractable integrations. The most widely used metric, the continuous ranked probability score (CRPS), is a strictly proper scoring function; however, its computation requires approximation. We found that popular CRPS estimators--specifically, the quantile-based estimator implemented in the widely used GluonTS library and the probability-weighted moment approximation--both exhibit inherent estimation biases. These biases lead to crude approximations, resulting in improper rankings of forecasting model performance when CRPS values are close. To address this issue, we introduced a kernel quadrature approach that leverages an unbiased CRPS estimator and employs cubature construction for scalable computation. Empirically, our approach consistently outperforms the two widely used CRPS estimators.
- Abstract(参考訳): 確率的時系列予測モデルの重要性にもかかわらず、その評価指標は難解な統合を伴うことが多い。
最も広く使われている測度であるCRPS(Continuous Rank probability score)は厳密に適切なスコアリング関数であるが、計算には近似が必要である。
一般に使われているGluonTSライブラリと確率重み付きモーメント近似に実装された量子型推定器は,それぞれ固有の推定バイアスを示す。
これらのバイアスは粗悪な近似につながり、CRPS値が近いときに予測モデルの性能が不適切なランキングとなる。
この問題に対処するため、我々は、非バイアスのCRPS推定器を活用し、スケーラブルな計算にキュキュア構成を用いるカーネル・クアチュア・アプローチを導入した。
経験的に、我々のアプローチは、広く使われている2つのCRPS推定器より一貫して優れています。
関連論文リスト
- In-Context Parametric Inference: Point or Distribution Estimators? [66.22308335324239]
償却点推定器は一般に後部推論より優れているが、後者は低次元問題では競争力がある。
実験の結果, 償却点推定器は一般に後部推定より優れているが, 後者は低次元問題では競争力があることがわかった。
論文 参考訳(メタデータ) (2025-02-17T10:00:24Z) - Score Matching-based Pseudolikelihood Estimation of Neural Marked
Spatio-Temporal Point Process with Uncertainty Quantification [59.81904428056924]
我々は、不確実な定量化を伴うmarkPsを学習するためのスコアMAtching推定器であるSMASHを紹介する。
具体的には,スコアマッチングによるマークPsの擬似的類似度を推定することにより,正規化自由度を推定する。
提案手法の優れた性能は、事象予測と不確実性定量化の両方において広範な実験によって実証される。
論文 参考訳(メタデータ) (2023-10-25T02:37:51Z) - Bayesian Cramér-Rao Bound Estimation with Score-Based Models [3.4480437706804503]
ベイジアンクラム・ラオ境界(英語版)(英: Bayesian Cram'er-Rao bound, CRB)は、任意のベイジアン推定器の平均二乗誤差に対する下界を与える。
本研究は,スコアマッチングを用いたCRBのための新しいデータ駆動推定手法を提案する。
論文 参考訳(メタデータ) (2023-09-28T00:22:21Z) - Mathematical Properties of Continuous Ranked Probability Score
Forecasting [0.0]
分布回帰法によるCRPSの収束率について検討する。
分布回帰に対するk-アネレスト近傍法とカーネル法が,次元$dgeq2$の収束率の最適値に達することを示す。
論文 参考訳(メタデータ) (2022-05-09T15:01:13Z) - Random Noise vs State-of-the-Art Probabilistic Forecasting Methods : A
Case Study on CRPS-Sum Discrimination Ability [4.9449660544238085]
対象データの統計的特性がCRPS-Sumの識別能力に影響を及ぼすことを示す。
CRPS-Sum計算は各次元におけるモデルの性能を見落としている。
ダミーモデルに対して,ランダムノイズのように見える,より優れたCRPS-Sumを持つことが容易に可能であることを示す。
論文 参考訳(メタデータ) (2022-01-21T12:36:58Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Evaluating probabilistic classifiers: Reliability diagrams and score
decompositions revisited [68.8204255655161]
確率的に統計的に一貫性があり、最適に結合し、再現可能な信頼性図を自動生成するCORP手法を導入する。
コーパスは非パラメトリックアイソトニック回帰に基づいており、プール・アジャセント・ヴァイオレータ(PAV)アルゴリズムによって実装されている。
論文 参考訳(メタデータ) (2020-08-07T08:22:26Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z) - Distributional robustness of K-class estimators and the PULSE [4.56877715768796]
古典的Kクラス推定器は、Kクラス推定器とアンカー回帰との接続を確立することにより、そのような最適性を満たすことを証明する。
データ駆動型シミュレーションKクラス推定器として効率的に計算できることを示す。
弱い楽器の設定を含むいくつかの設定があり、他の推定値よりも優れています。
論文 参考訳(メタデータ) (2020-05-07T09:39:07Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。