Fugu-MT 論文翻訳(概要): CrossSplit: Mitigating Label Noise Memorization through Data Splitting

論文の概要: CrossSplit: Mitigating Label Noise Memorization through Data Splitting

arxiv url: http://arxiv.org/abs/2212.01674v2
Date: Wed, 26 Apr 2023 15:33:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-27 17:57:47.944169
Title: CrossSplit: Mitigating Label Noise Memorization through Data Splitting
Title（参考訳）: CrossSplit: データ分割によるラベルノイズ記憶の軽減
Authors: Jihye Kim, Aristide Baratin, Yan Zhang, Simon Lacoste-Julien
Abstract要約: そこで我々はCrossSplitと呼ばれるノイズラベルの記憶を緩和するための新しいトレーニング手法を提案する。 CIFAR-10, CIFAR-100, Tiny-ImageNet, およびmini-WebVisionデータセットを用いた実験により, 本手法は幅広いノイズ比において最先端の手法より優れていることが示された。
参考スコア（独自算出の注目度）: 25.344386272010397
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We approach the problem of improving robustness of deep learning algorithms in the presence of label noise. Building upon existing label correction and co-teaching methods, we propose a novel training procedure to mitigate the memorization of noisy labels, called CrossSplit, which uses a pair of neural networks trained on two disjoint parts of the labelled dataset. CrossSplit combines two main ingredients: (i) Cross-split label correction. The idea is that, since the model trained on one part of the data cannot memorize example-label pairs from the other part, the training labels presented to each network can be smoothly adjusted by using the predictions of its peer network; (ii) Cross-split semi-supervised training. A network trained on one part of the data also uses the unlabeled inputs of the other part. Extensive experiments on CIFAR-10, CIFAR-100, Tiny-ImageNet and mini-WebVision datasets demonstrate that our method can outperform the current state-of-the-art in a wide range of noise ratios.
Abstract（参考訳）: 本稿では,ラベルノイズの存在下でのディープラーニングアルゴリズムの堅牢性向上の問題にアプローチする。ラベル付きデータセットの2つの部分でトレーニングされた2つのニューラルネットワークを使用するクロススプリット(CrossSplit)と呼ばれる,既存のラベル補正と共同学習手法に基づいて,ノイズラベルの記憶を緩和する新たなトレーニング手順を提案する。 CrossSplitは2つの主要な材料を組み合わせています。 (i)クロススプリットラベル補正。データの一方でトレーニングされたモデルは、他方から例ラベルペアを記憶できないので、ピアネットワークの予測を用いて各ネットワークに提示されるトレーニングラベルをスムーズに調整することができる。 (ii)クロススプリット半監督訓練。データの一部でトレーニングされたネットワークは、他の部分のラベルのない入力も使用する。 CIFAR-10, CIFAR-100, Tiny-ImageNet, および mini-WebVision データセットの大規模な実験により, 本手法は, 幅広いノイズ比において, 最先端技術より優れていることを示す。

関連論文リスト

Co-Training with Active Contrastive Learning and Meta-Pseudo-Labeling on 2D Projections for Deep Semi-Supervised Learning [42.56511266791916]
SSLはこの課題に対処し、ラベル付きで豊富なラベル付けされていないデータを活用する。教師によるメタ擬似ラベリングとALを効果的に組み合わせた能動型DeepFAを提案する。
論文参考訳（メタデータ） (2025-04-25T19:41:45Z)
JointMatch: A Unified Approach for Diverse and Collaborative Pseudo-Labeling to Semi-Supervised Text Classification [65.268245109828]
半教師付きテキスト分類(SSTC)は、ラベルのないデータを活用する能力によって注目を集めている。擬似ラベルに基づく既存のアプローチは、擬似ラベルバイアスと誤り蓄積の問題に悩まされる。我々は、最近の半教師付き学習からアイデアを統一することでこれらの課題に対処する、SSTCの総合的なアプローチであるJointMatchを提案する。
論文参考訳（メタデータ） (2023-10-23T05:43:35Z)
ProtoCon: Pseudo-label Refinement via Online Clustering and Prototypical Consistency for Efficient Semi-supervised Learning [60.57998388590556]
ProtoConは信頼性に基づく疑似ラベル作成の新しい手法である。 ProtoConのオンライン版では、データセット全体のラベル履歴を1回のトレーニングサイクルで活用することができる。最先端のデータセットよりも大幅に向上し、より高速に収束する。
論文参考訳（メタデータ） (2023-03-22T23:51:54Z)
Learning from Data with Noisy Labels Using Temporal Self-Ensemble [11.245833546360386]
ディープニューラルネットワーク(DNN)はノイズラベルを記憶する膨大な能力を持つ。現在最先端の手法では、損失の少ないサンプルを用いて二重ネットワークを訓練するコトレーニング方式が提案されている。本稿では,単一のネットワークのみをトレーニングすることで,シンプルで効果的なロバストトレーニング手法を提案する。
論文参考訳（メタデータ） (2022-07-21T08:16:31Z)
Synergistic Network Learning and Label Correction for Noise-robust Image Classification [28.27739181560233]
ディープニューラルネットワーク(DNN)は、トレーニングラベルノイズに過度に適合する傾向があるため、実際のモデルパフォーマンスは低下する。損失選択と雑音補正のアイデアを組み合わせたロバストなラベル補正フレームワークを提案する。ノイズタイプやレートの異なる合成および実世界のデータセット上で,本手法を実証する。
論文参考訳（メタデータ） (2022-02-27T23:06:31Z)
GuidedMix-Net: Semi-supervised Semantic Segmentation by Using Labeled Images as Reference [90.5402652758316]
半教師付きセマンティックセマンティックセグメンテーションのための新しい手法である GuidedMix-Net を提案する。ラベル付き情報を使用して、ラベルなしのインスタンスの学習をガイドする。競合セグメンテーションの精度を達成し、mIoUを以前のアプローチに比べて+7$%大きく改善する。
論文参考訳（メタデータ） (2021-12-28T06:48:03Z)
S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文参考訳（メタデータ） (2021-11-22T15:49:20Z)
Cross-domain Speech Recognition with Unsupervised Character-level Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。 Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文参考訳（メタデータ） (2021-04-15T14:36:54Z)
Co-Seg: An Image Segmentation Framework Against Label Corruption [8.219887855003648]
改良されたディープラーニングのパフォーマンスは、トレーニングのための高品質なラベルの可用性に強く結びついている。我々は,低品質なノイズラベルを含むデータセット上でセグメンテーションネットワークを協調的に学習する新しいフレームワーク,Co-Segを提案する。我々のフレームワークはどんなセグメンテーションアルゴリズムでも容易に実装でき、ノイズの多いラベルへのロバスト性を高めることができる。
論文参考訳（メタデータ） (2021-01-31T20:01:40Z)
Combating noisy labels by agreement: A joint training method with co-regularization [27.578738673827658]
トレーニング中の2つのネットワークの多様性を低減することを目的とした,JoCoRと呼ばれる堅牢な学習パラダイムを提案する。ノイズラベルを用いた学習において,JoCoRは最先端の多くのアプローチよりも優れていることを示す。
論文参考訳（メタデータ） (2020-03-05T16:42:41Z)
DivideMix: Learning with Noisy Labels as Semi-supervised Learning [111.03364864022261]
ノイズラベルを学習するためのフレームワークであるDivideMixを提案する。複数のベンチマークデータセットの実験は、最先端の手法よりも大幅に改善されている。
論文参考訳（メタデータ） (2020-02-18T06:20:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。