論文の概要: When Accuracy Is Not Enough: Uncertainty Collapse between Noisy Label Learning and Out-of-Distribution Detection
- arxiv url: http://arxiv.org/abs/2605.17795v1
- Date: Mon, 18 May 2026 03:19:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.700626
- Title: When Accuracy Is Not Enough: Uncertainty Collapse between Noisy Label Learning and Out-of-Distribution Detection
- Title(参考訳): 精度が不十分な場合:ノイズラベル学習とアウト・オブ・ディストリビューション検出の不確かさ
- Authors: Ningkang Peng, Jingyang Mao, Runhan Zhou, Peirong Ma, Yanhui Gu,
- Abstract要約: 雑音ラベル(LNL)を用いた学習は通常、クローズドセットの分類精度によってベンチマークされる。
本稿では,LNLチェックポイントを凍結し,ニア/ファー-OODルーティングとポストホックスコアを標準化して評価する,学習者に依存しないACC-OODベンチマークを提案する。
これらの結果は、クローズドセットの一般化、オープンワールドの信頼性、構造的重複診断を共レポートするLNLベンチマークをサポートする。
- 参考スコア(独自算出の注目度): 5.922967156812547
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Learning with noisy labels (LNL) is typically benchmarked by closed-set classification accuracy, yet deployment often requires classifiers to reject out-of-distribution (OOD) inputs. We present a learner-agnostic ACC-OOD benchmark that freezes LNL checkpoints and evaluates them with standardized near-/far-OOD routing and post-hoc scores across synthetic and real label noise. The benchmark reveals a recurring failure mode: high closed-set accuracy does not ensure OOD reliability, because low-confidence, misclassified in-distribution samples can overlap the score and feature regions occupied by OOD inputs under noisy training. We term this pathology uncertainty collapse. This structural overlap can make high-accuracy LNL methods lose separability at the ID-error/OOD interface under standard OOD scores. As an intervention, we study Virtual Margin Regularization (VMR), a lightweight repair probe demonstrated mainly with PSSCL that synthesizes boundary virtual outliers on trusted ID batches and widens the energy margin. VMR partially reduces the collapse-induced far-OOD failure without replacing the host objective or sacrificing closed-set accuracy in the tested settings. These results support LNL benchmarks that co-report closed-set generalization, open-world reliability, and structural overlap diagnostics.
- Abstract(参考訳): 雑音ラベル(LNL)による学習は、通常、クローズドセットの分類精度によってベンチマークされるが、デプロイでは、アウト・オブ・ディストリビューション(OOD)入力を拒否するために分類器を必要とすることが多い。
本稿では,LNLチェックポイントを凍結し,近距離/遠距離のルーティングとポストホックスコアを合成および実ラベルのノイズに対して適用することにより,LNLチェックポイントを凍結する学習者に依存しないACC-OODベンチマークを提案する。
高いクローズドセット精度は、OODの信頼性を保証しない、なぜなら、低信頼度で分類された分布内サンプルは、ノイズのあるトレーニングでOOD入力が占めるスコアと特徴領域を重複させる可能性があるからである。
我々はこの病理不確実性崩壊を表現している。
この構造的重複は、標準的なOODスコアの下でのID-error/OODインタフェースにおいて、高精度なLNLメソッドの分離性を損なう可能性がある。
そこで本研究では,仮想マージン正規化(VMR, Virtual Margin Regularization, 仮想マージン正規化)について検討し, PSSCLを主成分として, 信頼されたIDバッチ上で境界仮想異常値を合成し, エネルギーマージンを拡大する軽量補修プローブについて検討した。
VMRは、ホストの目的を置き換えたり、テスト設定でクローズドセットの精度を犠牲にすることなく、崩壊によって引き起こされる極OOD障害を部分的に低減する。
これらの結果は、クローズドセットの一般化、オープンワールドの信頼性、構造的重複診断を共レポートするLNLベンチマークをサポートする。
関連論文リスト
- Discovery of Hidden Miscalibration Regimes [52.452902154360565]
モデルは何らかの入力を体系的に過信し、他人を過信することがある。
対応する誤校正分野を定義し,それを推定するための診断フレームワークを提案する。
提案手法は,入力空間のキャリブレーションを意識した表現を学習し,学習幾何学におけるカーネルの平滑化による符号付き局所的誤校正を推定する。
論文 参考訳(メタデータ) (2026-05-13T13:07:50Z) - Beyond Surface Statistics: Robust Conformal Prediction for LLMs via Internal Representations [36.24681446361556]
本稿では,内部表現を用いた質問応答のためのコンフォメーション・フレームワークを提案する。
本手法は,強いテキストレベルベースラインよりも高い妥当性-効率トレードオフを実現する。
これらの結果から,内部表現は分布シフトの下で表面レベルの不確かさが不安定である場合に,より情報的な整合性スコアを与える可能性が示唆された。
論文 参考訳(メタデータ) (2026-04-17T16:28:31Z) - From Misclassifications to Outliers: Joint Reliability Assessment in Classification [13.95428115564986]
信頼性の高いシステムは、アウト・オブ・ディストリビューション(OOD)入力を検出するだけでなく、イン・ディストリビューション(ID)エラーを予測すべきである。
OOD検出と故障予測を統合した統合評価フレームワークを提案する。
さまざまなシナリオにおける信頼性を大幅に向上する新しいアプローチであるSURE+を紹介します。
論文 参考訳(メタデータ) (2026-03-04T10:11:51Z) - USE: Uncertainty Structure Estimation for Robust Semi-Supervised Learning [6.021112703667433]
半教師付き学習(SSL)における不確実性構造推定(USE)の導入
USEはラベル付きセットのプロキシモデルをトレーニングし、ラベルなしサンプルのエントロピースコアを計算する。
USEが一貫して精度を向上し、OOD汚染のレベルが変化していることは明らかである。
論文 参考訳(メタデータ) (2026-02-28T01:31:46Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.22804234013273]
本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。
キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文 参考訳(メタデータ) (2025-04-20T09:20:55Z) - Are Domain Generalization Benchmarks with Accuracy on the Line Misspecified? [11.534630666670568]
モデルが活用できる不安定な統計的ショートカットである鮮やかな相関は、性能のアウト・オブ・ディストリビューションを低下させると予想される。
現状の実践は、排除しようとする刺激的なシグナルを真に強調することなく、"ロバスト性"を評価することを示しています。
論文 参考訳(メタデータ) (2025-03-31T19:50:04Z) - How Does Unlabeled Data Provably Help Out-of-Distribution Detection? [63.41681272937562]
in-distribution (ID) とout-of-distribution (OOD) の両データの不均一性のため、未ラベルの in-the-wild データは非自明である。
本稿では,理論的保証と実証的有効性の両方を提供する新たな学習フレームワークであるSAL(Separate And Learn)を紹介する。
論文 参考訳(メタデータ) (2024-02-05T20:36:33Z) - Threshold-Consistent Margin Loss for Open-World Deep Metric Learning [42.03620337000911]
画像検索にDeep Metric Learning (DML) で使われている既存の損失は、しばしば非均一なクラス内およびクラス間表現構造に繋がる。
不整合はしばしば、商用画像検索システムを展開する際のしきい値選択過程を複雑にする。
クラス間の動作特性の分散を定量化するOPIS(Operating-Point-Inconsistency-Score)と呼ばれる,新しい分散に基づく尺度を提案する。
論文 参考訳(メタデータ) (2023-07-08T21:16:41Z) - Provably Robust Detection of Out-of-distribution Data (almost) for free [124.14121487542613]
ディープニューラルネットワークは、アウト・オブ・ディストリビューション(OOD)データに対する高い過度な予測を生成することが知られている。
本稿では,認証可能なOOD検出器を標準分類器と組み合わせてOOD認識分類器を提案する。
このようにして、我々は2つの世界のベストを達成している。OOD検出は、分布内に近いOODサンプルであっても、予測精度を損なうことなく、非操作型OODデータに対する最先端のOOD検出性能に近接する。
論文 参考訳(メタデータ) (2021-06-08T11:40:49Z) - Certifiably Adversarially Robust Detection of Out-of-Distribution Data [111.67388500330273]
我々は,OOD点における信頼度を低くすることで,OOD検出の証明可能な最悪のケースを保証することを目的としている。
トレーニング時に見られるOODデータセットを超えて一般化されたOODデータの信頼性の非自明な境界が可能であることを示す。
論文 参考訳(メタデータ) (2020-07-16T17:16:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。