論文の概要: Task-Agnostic Noisy Label Detection via Standardized Loss Aggregation
- arxiv url: http://arxiv.org/abs/2605.10165v2
- Date: Wed, 20 May 2026 08:54:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 14:55:43.924257
- Title: Task-Agnostic Noisy Label Detection via Standardized Loss Aggregation
- Title(参考訳): 標準化ロスアグリゲーションによるタスク非依存ノイズラベル検出
- Authors: Inhyuk Park, Doohyun Park,
- Abstract要約: ノイズラベルは、大規模な医療画像データセットで一般的である。
統計的基盤とタスクに依存しないフレームワークであるStandardized Loss Aggregation(SLA)を提案する。
SLAは、標準化された折りたたみレベルのバリデーション損失を集約することで、ラベルの信頼性を定量化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Noisy labels are common in large-scale medical imaging datasets due to inter-observer variability and ambiguous cases. We propose a statistically grounded and task-agnostic framework, Standardized Loss Aggregation (SLA), for detecting noisy labels at the sample level. SLA quantifies label reliability by aggregating standardized fold-level validation losses across repeated cross-validation runs. This formulation generalizes discrete hard-counting schemes into a continuous estimator that captures both the frequency and magnitude of performance deviations, yielding interpretable and statistically stable noisiness scores. Experiments on a public fundus dataset demonstrate that SLA consistently outperforms the hard-counting baseline across all noise levels and converges substantially faster, especially under low noise ratios where subtle loss variations are informative. Samples with high SLA scores indicate potentially ambiguous or mislabeled cases, guiding efficient re-annotation and improving dataset reliability for any classification task.
- Abstract(参考訳): ノイズラベルは、サーバ間変動とあいまいなケースのために、大規模医療画像データセットで一般的である。
サンプルレベルでノイズラベルを検出するための統計的基盤とタスクに依存しないフレームワークであるStandardized Loss Aggregation(SLA)を提案する。
SLAは、繰り返しのクロスバリデーション実行間で標準化された折りたたみレベルのバリデーション損失を集約することで、ラベルの信頼性を定量化する。
この定式化は、離散的なハードカウントスキームを連続推定器に一般化し、周波数と性能差の大きさの両方を捉え、解釈可能かつ統計的に安定なノイズスコアを得る。
公立のファンドスデータセットの実験では、SLAはあらゆるノイズレベルのハードカウントベースラインを一貫して上回り、特に微妙な損失のばらつきが知らせられる低ノイズ比でかなり速く収束することを示した。
SLAスコアの高いサンプルは、潜在的にあいまいなケースやラベルの誤りを示し、効率的な再アノテーションを導き、あらゆる分類タスクにおけるデータセットの信頼性を改善します。
関連論文リスト
- Noise-Response Calibration: A Causal Intervention Protocol for LLM-Judges [7.061518504123362]
大規模言語モデル (LLMs) は、自動判断器や合成ラベル装置としてますます使われている。
制御された入力介入に基づく実用的なキャリブレーションプロトコルを提案する。
我々は、繰り返し試行錯誤による斜面ベースの仮説テストでこれを運用する。
論文 参考訳(メタデータ) (2026-03-17T22:08:06Z) - Control Variate Score Matching for Diffusion Models [34.30408848157335]
雑音スペクトル全体の分散最小化を理論的に保証する最適時間依存制御係数を導出したCVSIを導入する。
CVSIは,データフリーサンプリング学習と推論時間拡散サンプリングの両方において,サンプル効率を大幅に向上させる,堅牢で低分散なプラグイン推定器として機能することが実証された。
論文 参考訳(メタデータ) (2025-12-23T02:55:14Z) - Semi-Supervised Regression with Heteroscedastic Pseudo-Labels [50.54050677867914]
両レベル最適化の観点から,疑似ラベルの影響を動的に調整する不確実性認識型擬似ラベル化フレームワークを提案する。
我々は、様々なベンチマークSSRデータセットにまたがって、我々のアプローチを検証するための理論的洞察と広範な実験を提供する。
論文 参考訳(メタデータ) (2025-10-17T03:06:23Z) - Cross-Validation Is All You Need: A Statistical Approach To Label Noise Estimation [0.6612255136183889]
マシンラーニングモデルは、ノイズラベルの存在下でトレーニングされた場合、パフォーマンスが低下する。
これは、生存予測のような医療タスクに特に問題となる。
本稿では,2つの新しいラベルノイズ検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-24T14:50:20Z) - Learning from Noisy Labels with Coarse-to-Fine Sample Credibility
Modeling [22.62790706276081]
ノイズの多いラベルでディープニューラルネットワーク(DNN)を訓練することは事実上難しい。
従来の取り組みでは、統合されたデノナイジングフローで部分データや完全なデータを扱う傾向があります。
本研究では,ノイズの多いデータを分割・分散的に処理するために,CREMAと呼ばれる粗大な頑健な学習手法を提案する。
論文 参考訳(メタデータ) (2022-08-23T02:06:38Z) - Complementing Semi-Supervised Learning with Uncertainty Quantification [6.612035830987296]
そこで本研究では,アレータ性およびてんかん性不確実性定量化に依存する,教師なし不確実性認識の新たな目的を提案する。
CIFAR-100やMini-ImageNetのような複雑なデータセットでは,結果が最先端の成果よりも優れています。
論文 参考訳(メタデータ) (2022-07-22T00:15:02Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label
Selection Framework for Semi-Supervised Learning [53.1047775185362]
Pseudo-labeling (PL) は一般的な SSL アプローチで、この制約はありませんが、当初の処方では比較的不十分です。
PLは不整合モデルからの誤った高い信頼度予測により性能が低下していると論じる。
そこで本研究では,疑似ラベリング精度を向上させるための不確実性認識型擬似ラベル選択(ups)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-15T23:29:57Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。