論文の概要: Addressing Long-Tail Noisy Label Learning Problems: a Two-Stage Solution
with Label Refurbishment Considering Label Rarity
- arxiv url: http://arxiv.org/abs/2403.02363v1
- Date: Mon, 4 Mar 2024 08:06:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 17:30:26.952001
- Title: Addressing Long-Tail Noisy Label Learning Problems: a Two-Stage Solution
with Label Refurbishment Considering Label Rarity
- Title(参考訳): 長尾型ノイズラベル学習問題への取り組み--ラベルラリティを考慮したラベルリファービッシュメントによる2段階解法
- Authors: Ying-Hsuan Wu, Jun-Wei Hsieh, Li Xin, Shin-You Teng, Yi-Kuan Hsieh,
Ming-Ching Chang
- Abstract要約: ソフトレーベルの改修とマルチエキスパートのアンサンブル学習を組み合わせることで,効果的な2段階のアプローチを提案する。
頑健なソフトラベルの再構築の第1段階では, コントラスト学習により, 偏りのない特徴を習得する。
第2段階では,マルチエキスパート・アンサンブル学習のためのソフト・ラベルを得るために,ラベル改築法を適用した。
- 参考スコア(独自算出の注目度): 13.490974408726323
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world datasets commonly exhibit noisy labels and class imbalance, such
as long-tailed distributions. While previous research addresses this issue by
differentiating noisy and clean samples, reliance on information from
predictions based on noisy long-tailed data introduces potential errors. To
overcome the limitations of prior works, we introduce an effective two-stage
approach by combining soft-label refurbishing with multi-expert ensemble
learning. In the first stage of robust soft label refurbishing, we acquire
unbiased features through contrastive learning, making preliminary predictions
using a classifier trained with a carefully designed BAlanced Noise-tolerant
Cross-entropy (BANC) loss. In the second stage, our label refurbishment method
is applied to obtain soft labels for multi-expert ensemble learning, providing
a principled solution to the long-tail noisy label problem. Experiments
conducted across multiple benchmarks validate the superiority of our approach,
Label Refurbishment considering Label Rarity (LR^2), achieving remarkable
accuracies of 94.19% and 77.05% on simulated noisy CIFAR-10 and CIFAR-100
long-tail datasets, as well as 77.74% and 81.40% on real-noise long-tail
datasets, Food-101N and Animal-10N, surpassing existing state-of-the-art
methods.
- Abstract(参考訳): 実世界のデータセットは通常、長い尾の分布のようなノイズのあるラベルとクラス不均衡を示す。
これまでの研究では、ノイズとクリーンなサンプルを区別することでこの問題に対処しているが、ノイズの多いロングテールデータに基づく予測からの情報に依存することは、潜在的なエラーをもたらす。
先行研究の限界を克服するために,ソフトラベルリファービッシュとマルチエキスパートアンサンブル学習を組み合わせた効果的な2段階アプローチを提案する。
頑健なソフトラベル再構築の第1段階では, コントラスト学習により, BANC(BAlanced Noise-tolerant Cross-Entropy)の損失を慎重に設計した分類器を用いて, 事前予測を行う。
第2段階では,マルチエキスパート・アンサンブル学習のためのソフト・ラベルを得るためにラベル改質法を適用し,ロングテール雑音ラベル問題に対する基本解を提供する。
複数のベンチマークにおいて、ラベルララリティ(lr^2)を考慮したラベル改良を行い、ノイズの多いcifar-10とcifar-100のロングテールデータセットで94.19%と77.05%、リアルタイムのロングテールデータセットであるfood-101nとanimal-10nで77.74%と81.40%という驚くべき精度を達成した。
関連論文リスト
- Co-Learning Meets Stitch-Up for Noisy Multi-label Visual Recognition [70.00984078351927]
本稿では,多ラベル分類と長期学習の特徴に基づく雑音の低減に焦点をあてる。
よりクリーンなサンプルを合成し,マルチラベルノイズを直接低減するStitch-Up拡張を提案する。
ヘテロジニアス・コラーニング・フレームワークは、長い尾の分布とバランスの取れた分布の不整合を活用するためにさらに設計されている。
論文 参考訳(メタデータ) (2023-07-03T09:20:28Z) - Neighborhood Collective Estimation for Noisy Label Identification and
Correction [92.20697827784426]
ノイズラベルを用いた学習(LNL)は,ノイズラベルに対するモデルオーバーフィットの効果を軽減し,モデル性能と一般化を改善するための戦略を設計することを目的としている。
近年の進歩は、個々のサンプルのラベル分布を予測し、ノイズ検証とノイズラベル補正を行い、容易に確認バイアスを生じさせる。
提案手法では, 候補サンプルの予測信頼性を, 特徴空間近傍と対比することにより再推定する。
論文 参考訳(メタデータ) (2022-08-05T14:47:22Z) - Reliable Label Correction is a Good Booster When Learning with Extremely
Noisy Labels [65.79898033530408]
極音下での学習に明示的に取り組むために,LC-Boosterと呼ばれる新しい枠組みを導入する。
LC-Boosterは、ラベル補正をサンプル選択に組み込むことで、信頼性の高いラベル修正を通じて、より精製されたサンプルをトレーニングに利用することができる。
実験により、LC-Boosterはいくつかのノイズラベルベンチマークで最先端の結果を前進させることが示された。
論文 参考訳(メタデータ) (2022-04-30T07:19:03Z) - PARS: Pseudo-Label Aware Robust Sample Selection for Learning with Noisy
Labels [5.758073912084364]
PARS: Pseudo-Label Aware Robust Sample Selectionを提案する。
PARSは生・雑音ラベルと自己学習による擬似ラベルの推定・修正の両方を用いて、すべてのトレーニングサンプルを利用する。
その結果、PARSはCIFAR-10とCIFAR-100データセットに関する広範な研究において、技術の現状を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-01-26T09:31:55Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Robust Long-Tailed Learning under Label Noise [50.00837134041317]
本研究では,長期ラベル分布におけるラベルノイズ問題について検討する。
本稿では,長期学習のための雑音検出を実現する頑健なフレームワークAlgoを提案する。
我々のフレームワークは、半教師付き学習アルゴリズムを自然に活用して一般化をさらに改善することができる。
論文 参考訳(メタデータ) (2021-08-26T03:45:00Z) - Learning From Long-Tailed Data With Noisy Labels [0.0]
クラス不均衡とノイズラベルは多くの大規模分類データセットの標準である。
本稿では,近年の自己教師型学習の進歩をもとに,簡単な2段階のアプローチを提案する。
自己指導型学習アプローチは,重度のクラス不均衡に効果的に対処できることが判明した。
論文 参考訳(メタデータ) (2021-08-25T07:45:40Z) - Boosting Semi-Supervised Face Recognition with Noise Robustness [54.342992887966616]
本稿では,自動ラベルによるラベル雑音に対して頑健な半教師付き顔認識に対する効果的な解法を提案する。
そこで我々は,gnが強化するロバストな学習能力に基づく,ノイズロバスト学習ラベリング(nroll)という,半教師付き顔認識ソリューションを開発した。
論文 参考訳(メタデータ) (2021-05-10T14:43:11Z) - LongReMix: Robust Learning with High Confidence Samples in a Noisy Label
Environment [33.376639002442914]
新しい2段ノイズラベルトレーニングアルゴリズムLongReMixを提案します。
CIFAR-10, CIFAR-100, WebVision, Clothing1M, Food101-NでLongReMixを試験した。
私たちのアプローチは、ほとんどのデータセットで最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-03-06T18:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。