論文の概要: Plots of the cumulative differences between observed and expected values
of ordered Bernoulli variates
- arxiv url: http://arxiv.org/abs/2006.02504v3
- Date: Fri, 17 Jul 2020 01:49:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 17:45:04.313701
- Title: Plots of the cumulative differences between observed and expected values
of ordered Bernoulli variates
- Title(参考訳): 順序ベルヌーイ変量体の観測値と予測値の累積差のプロット
- Authors: Mark Tygert
- Abstract要約: 信頼性図」("calibration plots"とも呼ばれる)は、予測と結果の重大な相違を検出し、診断するのに役立つ。
標準信頼性図は、予測の観測値と期待値のヒストグラムに基づく。
標準信頼性図のいくつかの変種は、硬いヒストグラムをソフトカーネル密度推定に置き換えることを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many predictions are probabilistic in nature; for example, a prediction could
be for precipitation tomorrow, but with only a 30 percent chance. Given both
the predictions and the actual outcomes, "reliability diagrams" (also known as
"calibration plots") help detect and diagnose statistically significant
discrepancies between the predictions and the outcomes. The canonical
reliability diagrams are based on histogramming the observed and expected
values of the predictions; several variants of the standard reliability
diagrams propose to replace the hard histogram binning with soft kernel density
estimation using smooth convolutional kernels of widths similar to the widths
of the bins. In all cases, an important question naturally arises: which widths
are best (or are multiple plots with different widths better)? Rather than
answering this question, plots of the cumulative differences between the
observed and expected values largely avoid the question, by displaying
miscalibration directly as the slopes of secant lines for the graphs. Slope is
easy to perceive with quantitative precision even when the constant offsets of
the secant lines are irrelevant. There is no need to bin or perform kernel
density estimation with a somewhat arbitrary kernel.
- Abstract(参考訳): 例えば、明日の降水は予測できるが、30%の確率で予測できる。
予測と実際の結果の両方を考えると、「信頼度図」("reliability diagram")は、予測と結果の間の統計的に有意な相違を検出し、診断するのに役立ちます。
標準信頼性図は予測の観測値と期待値のヒストグラムに基づいており、標準信頼性図のいくつかの変種は、ビンの幅に類似した幅の滑らかな畳み込み核を用いて、ハードヒストグラムをソフトカーネル密度推定に置き換えることを提案している。
どの場合も、どの幅が一番良いか(または、異なる幅の複数のプロットの方が良いのか?
この問いに答える代わりに、観察値と期待値の累積差のプロットは、グラフの分離線の傾きとして直接ミスキャリブレーションを表示することによって、質問をほとんど避けている。
スロープは、セカントラインの一定オフセットが無関係であっても、定量的な精度で容易に認識できる。
何らかの任意のカーネルで、バイナリやカーネル密度推定を行う必要はない。
関連論文リスト
- Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - SoftCVI: Contrastive variational inference with self-generated soft labels [2.5398014196797614]
変分推論とマルコフ連鎖モンテカルロ法がこのタスクの主要なツールである。
ソフトコントラスト変動推論(SoftCVI)を導入し、コントラスト推定フレームワークを用いて変動対象のファミリーを導出する。
我々は、SoftCVIを用いて、訓練や大量発見に安定な目標を定式化することができ、他の変分アプローチよりも頻繁に優れた推論が可能であることを発見した。
論文 参考訳(メタデータ) (2024-07-22T14:54:12Z) - Awareness of uncertainty in classification using a multivariate model and multi-views [1.3048920509133808]
提案モデルでは,不確かさ予測を正規化し,予測と不確かさ推定の両方を計算する訓練を行う。
複数ビュー予測と不確かさと信頼度を考慮し、最終的な予測を計算する方法をいくつか提案した。
提案手法はクリーンでノイズの多いラベル付きCIFAR-10データセットを用いて検証した。
論文 参考訳(メタデータ) (2024-04-16T06:40:51Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - Nonparametric Probabilistic Regression with Coarse Learners [1.8275108630751844]
我々は, 密度の形状や形状について最小限の仮定で, 正確な条件密度を計算することができることを示す。
このアプローチをさまざまなデータセットで実証し、特に大きなデータセットで競合性能を示す。
論文 参考訳(メタデータ) (2022-10-28T16:25:26Z) - Precise Learning Curves and Higher-Order Scaling Limits for Dot Product
Kernel Regression [41.48538038768993]
本稿では,ドット積カーネルのカーネルリッジ回帰問題に焦点をあてる。
我々は、任意の整数$r$に対して$m approx dr/r!$が常に学習曲線のピークを観測し、複数のサンプルワイズと非自明な振る舞いを複数のスケールで達成する。
論文 参考訳(メタデータ) (2022-05-30T04:21:31Z) - Metrics of calibration for probabilistic predictions [0.0]
信頼性図」は統計的に有意な相違を検知・診断するのに役立ち、いわゆる「ミススキャリブレーション」と呼ばれる。
標準信頼性図は、予測の観測値と期待値のヒストグラムを示す。
しかし、どの幅のビンやカーネルが最善か?
セカントラインの一定のオフセットが無関係である場合でも、スロープは定量的な精度で容易に知覚できる。
論文 参考訳(メタデータ) (2022-05-19T16:38:24Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - Learning Accurate Dense Correspondences and When to Trust Them [161.76275845530964]
2つの画像に関連する密度の高い流れ場と、堅牢な画素方向の信頼度マップの推定を目指しています。
フロー予測とその不確実性を共同で学習するフレキシブルな確率的アプローチを開発する。
本手法は,幾何学的マッチングと光フローデータセットに挑戦する最新の結果を得る。
論文 参考訳(メタデータ) (2021-01-05T18:54:11Z) - Learning Disentangled Representations with Latent Variation
Predictability [102.4163768995288]
本稿では,潜在不整合表現の変動予測可能性について述べる。
逆生成プロセス内では、潜時変動と対応する画像対の相互情報を最大化することにより、変動予測可能性を高める。
本研究では,潜在表現の絡み合いを測るために,基礎的構造的生成因子に依存しない評価指標を開発する。
論文 参考訳(メタデータ) (2020-07-25T08:54:26Z) - Bayesian Deep Learning and a Probabilistic Perspective of Generalization [56.69671152009899]
ディープアンサンブルはベイズ辺化を近似する有効なメカニズムであることを示す。
また,アトラクションの流域内での辺縁化により,予測分布をさらに改善する関連手法を提案する。
論文 参考訳(メタデータ) (2020-02-20T15:13:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。