論文の概要: Conformal Prediction with Corrupted Labels: Uncertain Imputation and Robust Re-weighting
- arxiv url: http://arxiv.org/abs/2505.04733v1
- Date: Wed, 07 May 2025 18:46:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.643891
- Title: Conformal Prediction with Corrupted Labels: Uncertain Imputation and Robust Re-weighting
- Title(参考訳): 故障ラベルによるコンフォーマル予測:不確かさとロバスト再重み付け
- Authors: Shai Feldman, Stephen Bates, Yaniv Romano,
- Abstract要約: 本稿では,ラベル付きトレーニングデータが破損した状況において,ロバストな不確実性定量化のためのフレームワークを提案する。
我々は予測セットを生成する統計ツールである共形予測に基づいて構築する。
重み推定に依存しない新しい共形法である不確実な計算を導入する。
- 参考スコア(独自算出の注目度): 25.916898357807455
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce a framework for robust uncertainty quantification in situations where labeled training data are corrupted, through noisy or missing labels. We build on conformal prediction, a statistical tool for generating prediction sets that cover the test label with a pre-specified probability. The validity of conformal prediction, however, holds under the i.i.d assumption, which does not hold in our setting due to the corruptions in the data. To account for this distribution shift, the privileged conformal prediction (PCP) method proposed leveraging privileged information (PI) -- additional features available only during training -- to re-weight the data distribution, yielding valid prediction sets under the assumption that the weights are accurate. In this work, we analyze the robustness of PCP to inaccuracies in the weights. Our analysis indicates that PCP can still yield valid uncertainty estimates even when the weights are poorly estimated. Furthermore, we introduce uncertain imputation (UI), a new conformal method that does not rely on weight estimation. Instead, we impute corrupted labels in a way that preserves their uncertainty. Our approach is supported by theoretical guarantees and validated empirically on both synthetic and real benchmarks. Finally, we show that these techniques can be integrated into a triply robust framework, ensuring statistically valid predictions as long as at least one underlying method is valid.
- Abstract(参考訳): ラベル付きトレーニングデータがノイズや欠落ラベルによって破損する状況において、ロバストな不確実性定量化のための枠組みを導入する。
我々は、テストラベルを予め特定された確率でカバーする予測セットを生成する統計ツールである共形予測に基づいて構築する。
しかし、共形予測の妥当性はi.i.dの仮定に基づいており、この仮定はデータの腐敗のために私たちの設定では成り立たない。
この分布シフトを考慮するために、特権情報(PI)(トレーニング中にのみ利用可能な追加機能)を活用する特権共形予測(PCP)手法が提案され、重みが正確であるという仮定の下で有効な予測セットが与えられる。
そこで本研究では,PCPの重みの不正確性に対するロバスト性を解析した。
分析の結果,PCPでは,重量推定が不十分な場合でも,妥当な不確実性推定が可能であることがわかった。
さらに,重み推定に依存しない新しい共形法である不確かさ計算(UI)を導入する。
その代わりに、破損したラベルを、その不確実性を保ったままにします。
我々のアプローチは理論的保証に支えられ、人工ベンチマークと実ベンチマークの両方で実証的に検証される。
最後に、これらの手法を3つの頑健なフレームワークに統合し、少なくとも1つの基礎となる手法が有効である限り、統計的に妥当な予測を保証できることを示す。
関連論文リスト
- Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.42244686183879]
コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-13T15:37:11Z) - Beyond Conformal Predictors: Adaptive Conformal Inference with Confidence Predictors [0.0]
コンフォーマル予測は、ユーザ指定の重要度レベルで有効な予測セットを保証するために、交換可能なデータを必要とする。
適応共形推論 (Adaptive conformal inference, ACI) は、この制限に対処するために導入された。
我々は、ACIが共形予測器を必要とせず、より一般的な信頼性予測器で実装可能であることを示す。
論文 参考訳(メタデータ) (2024-09-23T21:02:33Z) - Robust Conformal Prediction Using Privileged Information [17.886554223172517]
本研究では,トレーニングデータの破損に対して堅牢な,保証されたカバレッジ率で予測セットを生成する手法を開発した。
我々のアプローチは、i.d仮定の下で有効となる予測セットを構築するための強力なフレームワークである共形予測に基づいている。
論文 参考訳(メタデータ) (2024-06-08T08:56:47Z) - PAC Prediction Sets Under Label Shift [52.30074177997787]
予測セットは、個々のラベルではなくラベルのセットを予測することによって不確実性を捉える。
ラベルシフト設定においてPAC保証付き予測セットを構築するための新しいアルゴリズムを提案する。
提案手法を5つのデータセットで評価する。
論文 参考訳(メタデータ) (2023-10-19T17:57:57Z) - Distribution-free uncertainty quantification for classification under
label shift [105.27463615756733]
2つの経路による分類問題に対する不確実性定量化(UQ)に焦点を当てる。
まず、ラベルシフトはカバレッジとキャリブレーションの低下を示すことでuqを損なうと論じる。
これらの手法を, 理論上, 分散性のない枠組みで検討し, その優れた実用性を示す。
論文 参考訳(メタデータ) (2021-03-04T20:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。