Fugu-MT 論文翻訳(概要): Estimating Expected Calibration Errors

論文の概要: Estimating Expected Calibration Errors

arxiv url: http://arxiv.org/abs/2109.03480v1
Date: Wed, 8 Sep 2021 08:00:23 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-10 00:30:56.295607
Title: Estimating Expected Calibration Errors
Title（参考訳）: 予測校正誤差の推定
Authors: Nicolas Posocco, Antoine Bonnefoy
Abstract要約: 確率論的予測の不確実性は、モデルが人間の意思決定をサポートするために使用される場合、重要な問題である。ほとんどのモデルは本質的に十分に校正されていないため、決定スコアは後続確率と一致しない。我々は、$ECE$推定器の品質を定量化するための実証的な手順を構築し、それを使用して、異なる設定で実際にどの推定器を使用するべきかを決定する。
参考スコア（独自算出の注目度）: 1.52292571922932
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Uncertainty in probabilistic classifiers predictions is a key concern when models are used to support human decision making, in broader probabilistic pipelines or when sensitive automatic decisions have to be taken. Studies have shown that most models are not intrinsically well calibrated, meaning that their decision scores are not consistent with posterior probabilities. Hence being able to calibrate these models, or enforce calibration while learning them, has regained interest in recent literature. In this context, properly assessing calibration is paramount to quantify new contributions tackling calibration. However, there is room for improvement for commonly used metrics and evaluation of calibration could benefit from deeper analyses. Thus this paper focuses on the empirical evaluation of calibration metrics in the context of classification. More specifically it evaluates different estimators of the Expected Calibration Error ($ECE$), amongst which legacy estimators and some novel ones, proposed in this paper. We build an empirical procedure to quantify the quality of these $ECE$ estimators, and use it to decide which estimator should be used in practice for different settings.
Abstract（参考訳）: 確率的分類器の予測の不確実性は、モデルが人間の意思決定、より広い確率的パイプライン、あるいはセンシティブな自動決定を行う必要がある場合に重要な関心事である。研究によれば、ほとんどのモデルは本質的によく調整されていないため、決定スコアは後発確率と一致しない。そのため、これらのモデルを校正したり、学習しながら校正を強制することができるようになり、近年の文献への関心が高まっている。この文脈では、キャリブレーションを適切に評価することは、キャリブレーションに取り組む新しい貢献を定量化する上で最重要である。しかし、一般的に使用されるメトリクスの改善の余地があり、キャリブレーションの評価はより深い分析の恩恵を受ける可能性がある。そこで本稿では,分類の文脈におけるキャリブレーション指標の実証的評価に着目する。より具体的には、従来の推定値といくつかの新しい推定値のうち、期待校正誤差(ECE$)の異なる推定値を評価する。我々は、これらの$ece$推定器の品質を定量化するための経験的手順を構築し、それを使用して、異なる設定で実際に使用される推定器を決定する。

関連論文リスト

Rethinking Early Stopping: Refine, Then Calibrate [49.966899634962374]
キャリブレーション・リファインメント分解の新規な変分定式化について述べる。我々は,校正誤差と精錬誤差が訓練中に同時に最小化されないという理論的,実証的な証拠を提供する。
論文参考訳（メタデータ） (2025-01-31T15:03:54Z)
Understanding Model Calibration -- A gentle introduction and visual exploration of calibration and the expected calibration error (ECE) [0.0]
このブログ記事では、キャリブレーションの最もよく使われる定義を見ていきます。次に、この尺度の欠点と、これらがどのようにキャリブレーションのさらなる概念の必要性を表面化したかを取り上げる。
論文参考訳（メタデータ） (2025-01-31T11:18:45Z)
Calibration through the Lens of Interpretability [3.9962751777898955]
キャリブレーションは、分類精度の上に有用なラベルの確率推定が必要な場合、頻繁に呼び出される概念である。本研究では,キャリブレーションの概念に関する公理的研究を開始する。キャリブレーションされたモデルの望ましい特性とそれに対応する評価指標をカタログ化し,その実現可能性と対応性について分析する。
論文参考訳（メタデータ） (2024-12-01T19:28:16Z)
Optimizing Estimators of Squared Calibration Errors in Classification [2.3020018305241337]
本稿では,2乗キャリブレーション誤差の推定器の比較と最適化を可能にする平均二乗誤差に基づくリスクを提案する。キャリブレーション誤差を推定する際のトレーニングバリデーションテストパイプラインを提案する。
論文参考訳（メタデータ） (2024-10-09T15:58:06Z)
Reassessing How to Compare and Improve the Calibration of Machine Learning Models [7.183341902583164]
結果の予測確率がモデル予測に基づいてその結果の観測周波数と一致した場合、機械学習モデルを校正する。キャリブレーションと予測の指標が追加の一般化の指標を伴わない限り、最先端のように見えるような簡単な再校正手法が存在することを示す。
論文参考訳（メタデータ） (2024-06-06T13:33:45Z)
Orthogonal Causal Calibration [55.28164682911196]
我々は、因果校正作業を標準(非因果予測モデル)の校正作業に還元する一般的なアルゴリズムを開発する。以上の結果から,既存のキャリブレーションアルゴリズムを因果的設定に応用できることが示唆された。
論文参考訳（メタデータ） (2024-06-04T03:35:25Z)
Towards Certification of Uncertainty Calibration under Adversarial Attacks [96.48317453951418]
攻撃はキャリブレーションを著しく損なう可能性を示し, 対向的摂動下でのキャリブレーションにおける最悪のキャリブレーション境界として認定キャリブレーションを提案する。我々は,新しいキャリブレーション攻撃を提案し,テクスタディバーショナルキャリブレーショントレーニングによりモデルキャリブレーションを改善する方法を示す。
論文参考訳（メタデータ） (2024-05-22T18:52:09Z)
From Uncertainty to Precision: Enhancing Binary Classifier Performance through Calibration [0.3495246564946556]
モデル予測スコアはイベント確率として一般的に見なされるので、キャリブレーションは正確な解釈に不可欠である。歪み評価のための様々なキャリブレーション尺度の感度を解析し,改良された指標であるローカルスコアを導入する。これらの知見をランダムフォレスト分類器と回帰器を用いて実世界のシナリオに適用し、キャリブレーションを同時に測定しながら信用デフォルトを予測する。
論文参考訳（メタデータ） (2024-02-12T16:55:19Z)
Calibration by Distribution Matching: Trainable Kernel Calibration Metrics [56.629245030893685]
カーネルベースのキャリブレーションメトリクスを導入し、分類と回帰の両方で一般的なキャリブレーションの形式を統一・一般化する。これらの指標は、異なるサンプル推定を許容しており、キャリブレーションの目的を経験的リスク最小化に組み込むのが容易である。決定タスクにキャリブレーションメトリクスを調整し、正確な損失推定を行ない、後悔しない決定を行うための直感的なメカニズムを提供する。
論文参考訳（メタデータ） (2023-10-31T06:19:40Z)
Calibration of Neural Networks [77.34726150561087]
本稿では,ニューラルネットワークの文脈における信頼性校正問題について調査する。我々は,問題文,キャリブレーション定義,評価に対する異なるアプローチについて分析する。実験実験では、様々なデータセットとモデルをカバーし、異なる基準に従って校正方法を比較する。
論文参考訳（メタデータ） (2023-03-19T20:27:51Z)
Better Uncertainty Calibration via Proper Scores for Classification and Beyond [15.981380319863527]
各校正誤差を適切なスコアに関連付ける適切な校正誤差の枠組みを導入する。この関係は、モデルのキャリブレーションの改善を確実に定量化するために利用することができる。
論文参考訳（メタデータ） (2022-03-15T12:46:08Z)
T-Cal: An optimal test for the calibration of predictive models [49.11538724574202]
有限検証データセットを用いた予測モデルの誤校正を仮説検証問題として検討する。誤校正の検出は、クラスの条件付き確率が予測の十分滑らかな関数である場合にのみ可能である。我々は、$ell$-Expected Error(ECE)のデバイアスドプラグイン推定器に基づくキャリブレーションのためのミニマックステストであるT-Calを提案する。
論文参考訳（メタデータ） (2022-03-03T16:58:54Z)
Localized Calibration: Metrics and Recalibration [133.07044916594361]
完全大域キャリブレーションと完全個別化キャリブレーションのギャップにまたがる細粒度キャリブレーション指標を提案する。次に,局所再校正法であるLoReを導入し,既存の校正法よりもLCEを改善する。
論文参考訳（メタデータ） (2021-02-22T07:22:12Z)
Unsupervised Calibration under Covariate Shift [92.02278658443166]
ドメインシフト下でのキャリブレーションの問題を導入し、それに対処するための重要サンプリングに基づくアプローチを提案する。実世界のデータセットと合成データセットの両方において,本手法の有効性を評価し検討した。
論文参考訳（メタデータ） (2020-06-29T21:50:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。