論文の概要: When to Trust Confidence Thresholding: Calibration Diagnostics for Pseudo-Labelled Regression
- arxiv url: http://arxiv.org/abs/2605.12780v1
- Date: Tue, 12 May 2026 21:49:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.703313
- Title: When to Trust Confidence Thresholding: Calibration Diagnostics for Pseudo-Labelled Regression
- Title(参考訳): 信頼度を信頼する時--擬似ラベル回帰の校正診断
- Authors: Marcell T. Kurbucz,
- Abstract要約: 標準的なプラクティスは、信頼性カットオフで校正されたスコアをしきい値にし、ハードラベルを真実として扱うことである。
疑似ラベリングパイプラインのためのキャリブレーション対応診断装置を開発した。
我々は、下流回帰係数において信頼しきい値が誘導する減衰バイアスの閉形式式を導出する。
- 参考スコア(独自算出の注目度): 1.14219428942199
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Calibrated probability outputs of trained classifiers are increasingly used as inputs to downstream regression estimands such as effects, prevalences, or disparities for a latent group observed only on a small labelled subset. A standard practice is to threshold the calibrated score at a confidence cutoff and treat the hard label as the truth. Building on a recent identification result for the underlying moment equation, we develop a calibration-aware diagnostic apparatus for pseudo-labelling pipelines. We derive a closed-form expression for the attenuation bias that confidence thresholding induces in the downstream regression coefficient, and show that the bias can be predicted, before any inference is run, from the residual score variance $V^{*}=\mathbb{E}[\operatorname{Var}(p\mid X)]$ on the unlabelled set after partialling out the downstream controls $X$. We further obtain a sharp sensitivity bound under bounded calibration drift, and identify the boundary $V^{*}=0$, which holds iff $p$ is a deterministic function of $X$; this motivates a structural separation between classifier features $W$ and downstream controls $X\subsetneq W$. Five controlled simulations and a UCI Adult illustration trace the predictions. The contribution is operational: a $(V^{*}, κ)$ decision rule that practitioners can compute from any classifier output to decide whether confidence thresholding is safe.
- Abstract(参考訳): 訓練された分類器の校正された確率出力は、小さなラベル付き部分集合でのみ観察される潜伏群に対する効果、有病率、不一致などの下流回帰推定への入力として、ますます用いられる。
標準的なプラクティスは、信頼性カットオフで校正されたスコアをしきい値にし、ハードラベルを真実として扱うことである。
近年のモーメント方程式の同定結果に基づいて,疑似ラベリングパイプラインのキャリブレーション対応診断装置を開発した。
我々は、信頼度閾値が下流回帰係数で誘導する減衰バイアスの閉形式式を導出し、残差値の分散である$V^{*}=\mathbb{E}[\operatorname{Var}(p\mid X)]$から、下流制御を部分化した後の未競合集合上で、任意の推論が実行される前にバイアスを予測可能であることを示す。
さらに、有界キャリブレーションドリフトの下で有界な鋭い感度を求め、その境界である$V^{*}=0$は、iff$p$は$X$の決定論的関数であり、これは分類器の特徴である$W$と下流制御の$X\subsetneq W$の構造的分離を動機付ける。
5つの制御されたシミュレーションとUCIアダルトイラストは予測を辿った。
a $(V^{*}, κ)$ decision rule that practices can compute from any classifier output to determine whether confidence thresholding is safe。
関連論文リスト
- Tight Convergence Rates for Online Distributed Linear Estimation with Adversarial Measurements [66.94250413799232]
分散パラメータ-サーバ-ワーカー設定における乱数ベクトル$X$の推定について検討する。
主な課題は、敵の計測と非同期である。
その結果, 分散線形推定におけるロバスト性, 識別性, 統計的効率の統一的有限時間評価が得られた。
論文 参考訳(メタデータ) (2026-04-07T11:45:55Z) - Partial Causal Structure Learning for Valid Selective Conformal Inference under Interventions [0.0]
ゲノミクスの実験では、交換可能性はしばしば、対象変数を「影響を受けない」ままにしておく介入のサブセットにのみ保持される。
i)「影響のない」キャリブレーション例の誤分類が、明示的な関数$g(,n)$の汚染分数とキャリブレーションセットサイズを介してどのようにカバレッジを劣化させるか、および (ii) 2つの後続指標$Z_a,i=mathbf1iinmathrmdesc(a)$のみを推定するタスク駆動部分因果学習の定式化。
論文 参考訳(メタデータ) (2026-03-02T18:58:22Z) - Optimal Unconstrained Self-Distillation in Ridge Regression: Strict Improvements, Precise Asymptotics, and One-Shot Tuning [61.07540493350384]
自己蒸留(英: Self-distillation, SD)とは、教師自身の予測と地道の混合で学生を訓練する過程である。
任意の予測リスクに対して、各正規化レベルにおいて、最適に混合された学生がリッジ教師に改善されることが示される。
本稿では,グリッド探索やサンプル分割,再構成なしに$star$を推定する一貫したワンショットチューニング手法を提案する。
論文 参考訳(メタデータ) (2026-02-19T17:21:15Z) - Pointwise confidence estimation in the non-linear $\ell^2$-regularized least squares [12.352761060862072]
固定設計による $ell2$-regularized 非線形最小二乗集合の高確率非漸近信頼度推定について検討する。
つまり、任意の固定テスト入力に対して$x$の予測を保持することを意味する。
論文 参考訳(メタデータ) (2025-06-08T11:23:49Z) - Backward Conformal Prediction [46.298122008420414]
我々は、予測セットのサイズを柔軟に制御しながら、コンフォーマルカバレッジを保証するメソッドである$textitBackward Conformal Prediction$を紹介した。
提案手法は,観測データに基づいて,予測セットサイズがどう振る舞うかを制約するルールを定義し,それに応じてカバレッジレベルを適応させる。
このアプローチは、医療診断のような大きな予測セットが実用的でないアプリケーションで特に有用である。
論文 参考訳(メタデータ) (2025-05-19T21:08:14Z) - Regression-Based Estimation of Causal Effects in the Presence of Selection Bias and Confounding [52.1068936424622]
治療が介入によって設定された場合、対象変数$Y$に対して、予測因果効果$E[Y|do(X)]$を推定する問題を考える。
選択バイアスや欠点のない設定では、$E[Y|do(X)] = E[Y|X]$ となる。
選択バイアスとコンバウンディングの両方を組み込んだフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-26T13:43:37Z) - Decision from Suboptimal Classifiers: Excess Risk Pre- and Post-Calibration [52.70324949884702]
バッチ二分決定における近似的後続確率を用いた余剰リスクの定量化を行う。
我々は、再校正のみが後悔のほとんどに対処する体制と、後悔が集団的損失に支配される体制を識別する。
NLP実験では、これらの量によって、より高度なポストトレーニングの期待値が運用コストに値するかどうかが分かる。
論文 参考訳(メタデータ) (2025-03-23T10:52:36Z) - Mind the Gap: A Causal Perspective on Bias Amplification in Prediction & Decision-Making [58.06306331390586]
本稿では,閾値演算による予測値がS$変化の程度を測るマージン補数の概念を導入する。
適切な因果仮定の下では、予測スコア$S$に対する$X$の影響は、真の結果$Y$に対する$X$の影響に等しいことを示す。
論文 参考訳(メタデータ) (2024-05-24T11:22:19Z) - On Computationally Efficient Multi-Class Calibration [9.032290717007065]
プロジェクトのキャリブレーションは、下流の意思決定者全員に強い保証を与えます。
これは、ラベルに割り当てられた確率を$T$にまとめることで予測される確率が、完全に校正されたバイナリ予測器に近いことを保証している。
論文 参考訳(メタデータ) (2024-02-12T17:25:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。