論文の概要: PASS: Peer-Agreement based Sample Selection for training with Noisy
Labels
- arxiv url: http://arxiv.org/abs/2303.10802v1
- Date: Mon, 20 Mar 2023 00:35:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 17:08:47.914033
- Title: PASS: Peer-Agreement based Sample Selection for training with Noisy
Labels
- Title(参考訳): PASS:雑音ラベルを用いた学習のためのピアアグリメントに基づくサンプル選択
- Authors: Arpit Garg, Cuong Nguyen, Rafael Felix, Thanh-Toan Do, Gustavo
Carneiro
- Abstract要約: モデルが過度に適合する傾向にあるため、ノイズラベルはディープラーニングにおいて大きな課題となる。
ピアアグリメントに基づく新しいサンプル選択(PASS)を提案する。
次に、合意スコアに自動しきい値付け手法を適用し、クリーンでノイズの多いラベルサンプルを選択する。
- 参考スコア(独自算出の注目度): 30.922188228545906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Noisy labels present a significant challenge in deep learning because models
are prone to overfitting. This problem has driven the development of
sophisticated techniques to address the issue, with one critical component
being the selection of clean and noisy label samples. Selecting noisy label
samples is commonly based on the small-loss hypothesis or on feature-based
sampling, but we present empirical evidence that shows that both strategies
struggle to differentiate between noisy label and hard samples, resulting in
relatively large proportions of samples falsely selected as clean. To address
this limitation, we propose a novel peer-agreement based sample selection
(PASS). An automated thresholding technique is then applied to the agreement
score to select clean and noisy label samples. PASS is designed to be easily
integrated into existing noisy label robust frameworks, and it involves
training a set of classifiers in a round-robin fashion, with peer models used
for sample selection. In the experiments, we integrate our PASS with several
state-of-the-art (SOTA) models, including InstanceGM, DivideMix, SSR, FaMUS,
AugDesc, and C2D, and evaluate their effectiveness on several noisy label
benchmark datasets, such as CIFAR-100, CIFAR-N, Animal-10N, Red Mini-Imagenet,
Clothing1M, Mini-Webvision, and Imagenet. Our results demonstrate that our new
sample selection approach improves the existing SOTA results of algorithms.
- Abstract(参考訳): モデルが過度に適合する傾向にあるため、ノイズラベルはディープラーニングにおいて大きな課題となる。
この問題は、クリーンでノイズの多いラベルのサンプルを選択することによる、この問題に対処する高度な技術の開発を促した。
ノイズラベルのサンプルの選択は, 一般に小損失仮説や特徴に基づくサンプリングに基づいているが, どちらの手法もノイズラベルとハードサンプルの区別に苦慮していることを示す実証的証拠を提示する。
この制限に対処するために、新しいピアアグリメントベースのサンプル選択(PASS)を提案する。
次に、合意スコアに自動しきい値付け手法を適用し、クリーンでノイズの多いラベルサンプルを選択する。
PASSは、既存のノイズの多いラベルの堅牢なフレームワークに簡単に統合できるように設計されており、サンプル選択に使用されるピアモデルとともに、ラウンドロビン方式で分類器のセットをトレーニングする。
実験では、instancegm, dividemix, ssr, famus, augdesc, c2dなどの最先端(sota)モデルと統合し、cifar-100, cifar-n, animal-10n, red mini-imagenet, clothing1m, mini-webvision, imagenetなどのノイズの多いラベルベンチマークデータセットの有効性を評価した。
その結果,新しいサンプル選択手法が既存のsoma結果を改善することが示された。
関連論文リスト
- Combating Label Noise With A General Surrogate Model For Sample
Selection [84.61367781175984]
本稿では,視覚言語サロゲートモデルCLIPを用いて,雑音の多いサンプルを自動的にフィルタリングする手法を提案する。
提案手法の有効性を実世界および合成ノイズデータセットで検証した。
論文 参考訳(メタデータ) (2023-10-16T14:43:27Z) - Co-Learning Meets Stitch-Up for Noisy Multi-label Visual Recognition [70.00984078351927]
本稿では,多ラベル分類と長期学習の特徴に基づく雑音の低減に焦点をあてる。
よりクリーンなサンプルを合成し,マルチラベルノイズを直接低減するStitch-Up拡張を提案する。
ヘテロジニアス・コラーニング・フレームワークは、長い尾の分布とバランスの取れた分布の不整合を活用するためにさらに設計されている。
論文 参考訳(メタデータ) (2023-07-03T09:20:28Z) - Neighborhood Collective Estimation for Noisy Label Identification and
Correction [92.20697827784426]
ノイズラベルを用いた学習(LNL)は,ノイズラベルに対するモデルオーバーフィットの効果を軽減し,モデル性能と一般化を改善するための戦略を設計することを目的としている。
近年の進歩は、個々のサンプルのラベル分布を予測し、ノイズ検証とノイズラベル補正を行い、容易に確認バイアスを生じさせる。
提案手法では, 候補サンプルの予測信頼性を, 特徴空間近傍と対比することにより再推定する。
論文 参考訳(メタデータ) (2022-08-05T14:47:22Z) - ProMix: Combating Label Noise via Maximizing Clean Sample Utility [18.305972075220765]
ProMixは、パフォーマンス向上のためのクリーンサンプルの有用性を最大化するフレームワークである。
CIFAR-Nデータセットの平均2.48%の改善を実現している。
論文 参考訳(メタデータ) (2022-07-21T03:01:04Z) - UNICON: Combating Label Noise Through Uniform Selection and Contrastive
Learning [89.56465237941013]
UNICONは,高ラベル雑音に対して頑健な,シンプルで効果的なサンプル選択法である。
90%のノイズレートでCIFAR100データセットの最先端データよりも11.4%改善した。
論文 参考訳(メタデータ) (2022-03-28T07:36:36Z) - Sample Prior Guided Robust Model Learning to Suppress Noisy Labels [8.119439844514973]
本稿では,サンプルの事前知識を発生させることで雑音を抑えるための深層モデルの学習を行う新しいフレームワークPGDFを提案する。
我々のフレームワークは、より有益なハードクリーンなサンプルをクリーンにラベル付けされたセットに保存することができる。
我々は,CIFAR-10とCIFAR-100に基づく合成データセットと,WebVisionとChrothing1Mを用いた実世界のデータセットを用いて評価を行った。
論文 参考訳(メタデータ) (2021-12-02T13:09:12Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - An Ensemble Noise-Robust K-fold Cross-Validation Selection Method for
Noisy Labels [0.9699640804685629]
大規模なデータセットには、ディープニューラルネットワーク(DNN)によって記憶されるような、ラベルのずれたサンプルが含まれている傾向があります。
本稿では, ノイズデータからクリーンなサンプルを効果的に選択するために, アンサンブルノイズ・ロバスト K-fold Cross-Validation Selection (E-NKCVS) を提案する。
我々は,ラベルが手動で異なる雑音比で破損した様々な画像・テキスト分類タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2021-07-06T02:14:52Z) - Transform consistency for learning with noisy labels [9.029861710944704]
単一のネットワークのみを用いてクリーンサンプルを同定する手法を提案する。
きれいなサンプルは元のイメージおよび変形したイメージのための一貫した予測に達することを好みます。
ノイズラベルの負の影響を軽減するために,オフラインのハードラベルとオンラインのソフトラベルを用いて分類損失を設計する。
論文 参考訳(メタデータ) (2021-03-25T14:33:13Z) - Jo-SRC: A Contrastive Approach for Combating Noisy Labels [58.867237220886885]
Jo-SRC (Joint Sample Selection and Model Regularization based on Consistency) というノイズロバスト手法を提案する。
具体的には、対照的な学習方法でネットワークをトレーニングする。
各サンプルの2つの異なるビューからの予測は、クリーンまたは分布不足の「可能性」を推定するために使用されます。
論文 参考訳(メタデータ) (2021-03-24T07:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。