論文の概要: Proper scoring rules for estimation and forecast evaluation
- arxiv url: http://arxiv.org/abs/2504.01781v1
- Date: Wed, 02 Apr 2025 14:46:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:19:59.207210
- Title: Proper scoring rules for estimation and forecast evaluation
- Title(参考訳): 評価・予測のための適切なスコアリングルール
- Authors: Kartik Waghmare, Johanna Ziegel,
- Abstract要約: 本稿では,適切なスコアリングルールの数学的基礎について概観する。
推定・予測評価における統計学と機械学習の役割について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Proper scoring rules have been a subject of growing interest in recent years, not only as tools for evaluation of probabilistic forecasts but also as methods for estimating probability distributions. In this article, we review the mathematical foundations of proper scoring rules including general characterization results and important families of scoring rules. We discuss their role in statistics and machine learning for estimation and forecast evaluation. Furthermore, we comment on interesting developments of their usage in applications.
- Abstract(参考訳): 近年、確率的予測を評価するツールとしてだけでなく、確率分布を推定する手法として、適切なスコアリングルールが注目されている。
本稿では,一般的な評価結果や重要なスコアリングルールのファミリーを含む,適切なスコアリングルールの数学的基礎を概観する。
推定・予測評価における統計学と機械学習の役割について論じる。
さらに、アプリケーションにおけるそれらの利用の興味深い展開についてコメントする。
関連論文リスト
- Consistency Checks for Language Model Forecasters [54.62507816753479]
予測器の性能を,論理的に異なる質問に対する予測の整合性の観点から測定する。
我々は,一連の基本質問を生成し,これらの質問から整合性チェックをインスタンス化し,予測者の予測を導き,予測の整合性を測定する自動評価システムを構築した。
論文 参考訳(メタデータ) (2024-12-24T16:51:35Z) - The Statistical Benefits of Quantile Temporal-Difference Learning for
Value Estimation [53.53493178394081]
我々は、分散強化学習アルゴリズムQTD(Quantile temporal-Difference Learning)を用いて分析する。
たとえ実践者が平均を超えるリターン分布に関心がなかったとしても、QTDは古典的なTD学習のような手法よりも優れたパフォーマンスを提供するかもしれない。
論文 参考訳(メタデータ) (2023-05-28T10:52:46Z) - Proper Scoring Rules for Survival Analysis [0.07614628596146598]
生存分析のための4つの厳密なスコアリングルールの拡張について検討した。
これらの拡張は、確率分布の推定の離散化から生じる特定の条件下では適切であることを示す。
論文 参考訳(メタデータ) (2023-05-01T01:50:24Z) - Regions of Reliability in the Evaluation of Multivariate Probabilistic
Forecasts [73.33395097728128]
時系列予測評価のための適切なスコアリングルールに関する最初の体系的な有限サンプル研究を提供する。
本研究では, 地中構造と予測分布のいくつかの重要な相違点をテストするために, 総合的な総合的合成ベンチマークを用いて解析を行った。
論文 参考訳(メタデータ) (2023-04-19T17:38:42Z) - ProbPNN: Enhancing Deep Probabilistic Forecasting with Statistical
Information [0.19573380763700712]
カレンダー駆動の周期性を明確に考慮した深層学習手法を提案する。
得られた正規化連続ランク確率スコア (nCRPS) と正規化ピンボール損失 (nPL) を2つのデータセットで比較することにより, ProbPNNを最先端のベンチマークでベンチマークした。
論文 参考訳(メタデータ) (2023-02-06T07:17:31Z) - A review of predictive uncertainty estimation with machine learning [0.0]
機械学習アルゴリズムを用いて予測不確実性推定の話題を概観する。
我々は確率的予測を評価するための関連する指標(一貫性スコアリング関数と適切なスコアリングルール)について論じる。
このレビューでは、ユーザーのニーズに合わせて新しいアルゴリズムを開発する方法についての理解を深める。
論文 参考訳(メタデータ) (2022-09-17T10:36:30Z) - Unifying Gradient Estimators for Meta-Reinforcement Learning via
Off-Policy Evaluation [53.83642844626703]
オフ・ポリシー評価に基づいて,高次値関数の高次微分を推定するための統一フレームワークを提供する。
本フレームワークは, ヘッセン推定の偏りと分散トレードオフを解明する特別事例として, 多くの先行的アプローチを解釈する。
論文 参考訳(メタデータ) (2021-06-24T15:58:01Z) - Demand Forecasting of Individual Probability Density Functions with
Machine Learning [0.0]
本研究では,予測分布の精度を評価する新しい手法を提案する。
教師付き機械学習手法であるCyclic Boostingを用いて、各予測が完全に説明可能であるように、完全な個別確率密度関数を予測できる。
論文 参考訳(メタデータ) (2020-09-15T13:05:05Z) - Counterfactual Predictions under Runtime Confounding [74.90756694584839]
本研究は, 過去のデータからすべての関連要因を抽出した環境で, 事実予測タスクについて検討する。
本稿では,この環境下での対実予測モデル学習のための2次ロバスト手法を提案する。
論文 参考訳(メタデータ) (2020-06-30T15:49:05Z) - Interpretable Off-Policy Evaluation in Reinforcement Learning by
Highlighting Influential Transitions [48.91284724066349]
強化学習におけるオフ政治評価は、医療や教育などの領域における将来の成果を改善するために観察データを使用する機会を提供する。
信頼区間のような従来の尺度は、ノイズ、限られたデータ、不確実性のために不十分である可能性がある。
我々は,人間専門家が政策評価評価評価の妥当性を分析できるように,ハイブリッドAIシステムとして機能する手法を開発した。
論文 参考訳(メタデータ) (2020-02-10T00:26:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。