Fugu-MT 論文翻訳(概要): Reassessing How to Compare and Improve the Calibration of Machine Learning Models

論文の概要: Reassessing How to Compare and Improve the Calibration of Machine Learning Models

arxiv url: http://arxiv.org/abs/2406.04068v1
Date: Thu, 6 Jun 2024 13:33:45 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-07 14:49:58.797237
Title: Reassessing How to Compare and Improve the Calibration of Machine Learning Models
Title（参考訳）: 機械学習モデルの校正方法と校正方法の再評価
Authors: Muthu Chidambaram, Rong Ge,
Abstract要約: 結果の予測確率がモデル予測に基づいてその結果の観測周波数と一致した場合、機械学習モデルを校正する。キャリブレーションと予測の指標が追加の一般化の指標を伴わない限り、最先端のように見えるような簡単な再校正手法が存在することを示す。
参考スコア（独自算出の注目度）: 7.183341902583164
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A machine learning model is calibrated if its predicted probability for an outcome matches the observed frequency for that outcome conditional on the model prediction. This property has become increasingly important as the impact of machine learning models has continued to spread to various domains. As a result, there are now a dizzying number of recent papers on measuring and improving the calibration of (specifically deep learning) models. In this work, we reassess the reporting of calibration metrics in the recent literature. We show that there exist trivial recalibration approaches that can appear seemingly state-of-the-art unless calibration and prediction metrics (i.e. test accuracy) are accompanied by additional generalization metrics such as negative log-likelihood. We then derive a calibration-based decomposition of Bregman divergences that can be used to both motivate a choice of calibration metric based on a generalization metric, and to detect trivial calibration. Finally, we apply these ideas to develop a new extension to reliability diagrams that can be used to jointly visualize calibration as well as the estimated generalization error of a model.
Abstract（参考訳）: 結果の予測確率がモデル予測に基づいてその結果の観測周波数と一致した場合、機械学習モデルを校正する。この性質は、機械学習モデルの影響が様々な領域に広がり続けているため、ますます重要になっている。その結果、(特にディープラーニング)モデルのキャリブレーションの測定と改善に関する最近の論文がめちゃくちゃに増えている。本研究では,最近の文献における校正基準の報告を再評価する。キャリブレーションと予測基準(検定精度)が負の対数のような追加の一般化指標を伴わない限り、最先端のように見えるような簡単な再校正手法が存在することを示す。次に、一般化計量に基づいてキャリブレーション計量の選択を動機付け、自明なキャリブレーションを検出するのに使用できるブレグマン微分のキャリブレーションに基づく分解を導出する。最後に、これらのアイデアを適用して、キャリブレーションとモデルの推定一般化誤差を共同で視覚化できる信頼性図の新たな拡張を開発する。

関連論文リスト

Rethinking Early Stopping: Refine, Then Calibrate [49.966899634962374]
キャリブレーション・リファインメント分解の新規な変分定式化について述べる。我々は,校正誤差と精錬誤差が訓練中に同時に最小化されないという理論的,実証的な証拠を提供する。
論文参考訳（メタデータ） (2025-01-31T15:03:54Z)
Optimizing Estimators of Squared Calibration Errors in Classification [2.3020018305241337]
本稿では,2乗キャリブレーション誤差の推定器の比較と最適化を可能にする平均二乗誤差に基づくリスクを提案する。キャリブレーション誤差を推定する際のトレーニングバリデーションテストパイプラインを提案する。
論文参考訳（メタデータ） (2024-10-09T15:58:06Z)
Towards Certification of Uncertainty Calibration under Adversarial Attacks [96.48317453951418]
攻撃はキャリブレーションを著しく損なう可能性を示し, 対向的摂動下でのキャリブレーションにおける最悪のキャリブレーション境界として認定キャリブレーションを提案する。我々は,新しいキャリブレーション攻撃を提案し,テクスタディバーショナルキャリブレーショントレーニングによりモデルキャリブレーションを改善する方法を示す。
論文参考訳（メタデータ） (2024-05-22T18:52:09Z)
Calibrating Large Language Models with Sample Consistency [76.23956851098598]
本稿では,複数サンプルモデル生成系の分布から信頼度を導出する可能性について,一貫性の3つの尺度を用いて検討する。その結果、一貫性に基づくキャリブレーション手法は、既存のポストホック手法よりも優れていることがわかった。種々のLMの特性に合わせて,キャリブレーションに適した整合性指標を選択するための実用的なガイダンスを提供する。
論文参考訳（メタデータ） (2024-02-21T16:15:20Z)
Consistent and Asymptotically Unbiased Estimation of Proper Calibration Errors [23.819464242327257]
本稿では,全ての適切な校正誤差と精錬項を一貫した推定を可能にする手法を提案する。ニューラルネットワークにおける情報単調性を意味するf-分節と精製の関係を実証する。本実験は,提案した推定器のクレーム特性を検証し,特に関心のキャリブレーション誤差によって,ポストホックキャリブレーション法の選択が決定されるべきであることを示唆した。
論文参考訳（メタデータ） (2023-12-14T01:20:08Z)
Calibration by Distribution Matching: Trainable Kernel Calibration Metrics [56.629245030893685]
カーネルベースのキャリブレーションメトリクスを導入し、分類と回帰の両方で一般的なキャリブレーションの形式を統一・一般化する。これらの指標は、異なるサンプル推定を許容しており、キャリブレーションの目的を経験的リスク最小化に組み込むのが容易である。決定タスクにキャリブレーションメトリクスを調整し、正確な損失推定を行ない、後悔しない決定を行うための直感的なメカニズムを提供する。
論文参考訳（メタデータ） (2023-10-31T06:19:40Z)
Calibration of Neural Networks [77.34726150561087]
本稿では,ニューラルネットワークの文脈における信頼性校正問題について調査する。我々は,問題文,キャリブレーション定義,評価に対する異なるアプローチについて分析する。実験実験では、様々なデータセットとモデルをカバーし、異なる基準に従って校正方法を比較する。
論文参考訳（メタデータ） (2023-03-19T20:27:51Z)
On Calibrating Semantic Segmentation Models: Analyses and An Algorithm [51.85289816613351]
セマンティックセグメンテーションキャリブレーションの問題について検討する。モデルキャパシティ、作物サイズ、マルチスケールテスト、予測精度はキャリブレーションに影響を及ぼす。我々は、単純で統一的で効果的なアプローチ、すなわち選択的スケーリングを提案する。
論文参考訳（メタデータ） (2022-12-22T22:05:16Z)
Calibration tests beyond classification [30.616624345970973]
ほとんどの教師付き機械学習タスクは、既約予測エラーを被る。確率論的予測モデルは、妥当な目標に対する信念を表す確率分布を提供することによって、この制限に対処する。校正されたモデルは、予測が過信でも過信でもないことを保証します。
論文参考訳（メタデータ） (2022-10-21T09:49:57Z)
Variable-Based Calibration for Machine Learning Classifiers [11.9995808096481]
モデルのキャリブレーション特性を特徴付けるために,変数ベースのキャリブレーションの概念を導入する。ほぼ完全なキャリブレーション誤差を持つモデルでは,データの特徴の関数としてかなりの誤校正が期待できることがわかった。
論文参考訳（メタデータ） (2022-09-30T00:49:31Z)
Calibrate: Interactive Analysis of Probabilistic Model Output [5.444048397001003]
従来の手法の欠点に耐性のある,インタラクティブな信頼性図であるCalibrateを提示する。実世界のデータと合成データの両方のユースケースを通じて、Calibrateの実用性を実証する。
論文参考訳（メタデータ） (2022-07-27T20:01:27Z)
Modular Conformal Calibration [80.33410096908872]
回帰における再校正のためのアルゴリズムを多種多様なクラスで導入する。このフレームワークは、任意の回帰モデルをキャリブレーションされた確率モデルに変換することを可能にする。我々は17の回帰データセットに対するMCCの実証的研究を行った。
論文参考訳（メタデータ） (2022-06-23T03:25:23Z)
Better Uncertainty Calibration via Proper Scores for Classification and Beyond [15.981380319863527]
各校正誤差を適切なスコアに関連付ける適切な校正誤差の枠組みを導入する。この関係は、モデルのキャリブレーションの改善を確実に定量化するために利用することができる。
論文参考訳（メタデータ） (2022-03-15T12:46:08Z)
Estimating Expected Calibration Errors [1.52292571922932]
確率論的予測の不確実性は、モデルが人間の意思決定をサポートするために使用される場合、重要な問題である。ほとんどのモデルは本質的に十分に校正されていないため、決定スコアは後続確率と一致しない。我々は、$ECE$推定器の品質を定量化するための実証的な手順を構築し、それを使用して、異なる設定で実際にどの推定器を使用するべきかを決定する。
論文参考訳（メタデータ） (2021-09-08T08:00:23Z)
Localized Calibration: Metrics and Recalibration [133.07044916594361]
完全大域キャリブレーションと完全個別化キャリブレーションのギャップにまたがる細粒度キャリブレーション指標を提案する。次に,局所再校正法であるLoReを導入し,既存の校正法よりもLCEを改善する。
論文参考訳（メタデータ） (2021-02-22T07:22:12Z)
Quantile Regularization: Towards Implicit Calibration of Regression Models [30.872605139672086]
2つのCDF間の累積KL分散として定義される新しい量子正規化器に基づく回帰モデルの校正法を提案する。提案手法は,Dropout VI や Deep Ensembles といった手法を用いて学習した回帰モデルのキャリブレーションを大幅に改善することを示す。
論文参考訳（メタデータ） (2020-02-28T16:53:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。