論文の概要: Salvage Reusable Samples from Noisy Data for Robust Learning
- arxiv url: http://arxiv.org/abs/2008.02427v1
- Date: Thu, 6 Aug 2020 02:07:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 07:47:28.921375
- Title: Salvage Reusable Samples from Noisy Data for Robust Learning
- Title(参考訳): ロバスト学習のためのノイズデータからの回収可能なサンプル
- Authors: Zeren Sun, Xian-Sheng Hua, Yazhou Yao, Xiu-Shen Wei, Guosheng Hu, Jian
Zhang
- Abstract要約: 本稿では,Web画像を用いた深部FGモデルのトレーニングにおいて,ラベルノイズに対処するための再利用可能なサンプル選択と修正手法を提案する。
私たちのキーとなるアイデアは、再利用可能なサンプルの追加と修正を行い、それらをクリーンな例とともに活用してネットワークを更新することです。
- 参考スコア(独自算出の注目度): 70.48919625304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the existence of label noise in web images and the high memorization
capacity of deep neural networks, training deep fine-grained (FG) models
directly through web images tends to have an inferior recognition ability. In
the literature, to alleviate this issue, loss correction methods try to
estimate the noise transition matrix, but the inevitable false correction would
cause severe accumulated errors. Sample selection methods identify clean
("easy") samples based on the fact that small losses can alleviate the
accumulated errors. However, "hard" and mislabeled examples that can both boost
the robustness of FG models are also dropped. To this end, we propose a
certainty-based reusable sample selection and correction approach, termed as
CRSSC, for coping with label noise in training deep FG models with web images.
Our key idea is to additionally identify and correct reusable samples, and then
leverage them together with clean examples to update the networks. We
demonstrate the superiority of the proposed approach from both theoretical and
experimental perspectives.
- Abstract(参考訳): Web画像にラベルノイズがあり、ディープニューラルネットワークの高記憶能力があるため、Web画像を介して直接深部きめ細かい(FG)モデルを訓練することは、認識能力が劣る傾向にある。
この問題を緩和するために、損失補正法はノイズ遷移行列の推定を試みるが、避けられない誤訂正は重度の累積誤差を引き起こす。
サンプル選択方法は、小さな損失が蓄積したエラーを軽減できるという事実に基づいて、クリーンな(簡単)サンプルを識別する。
しかし、FGモデルのロバスト性を高める「ハード」と「ミスラベル」の例も減少する。
そこで本研究では,Web画像を用いた深部FGモデルのトレーニングにおいて,ラベルノイズに対処する,確実性に基づく再利用可能なサンプル選択と修正手法を提案する。
重要なアイデアは、再利用可能なサンプルを識別して修正し、それらをクリーンなサンプルと一緒に活用してネットワークを更新することです。
理論と実験の両方の観点から,提案手法の優越性を示す。
関連論文リスト
- An accurate detection is not all you need to combat label noise in web-noisy datasets [23.020126612431746]
分離した超平面の直接推定により,OOD試料の正確な検出が可能であることを示す。
本稿では,線形分離を用いた雑音検出とSOTA(State-of-the-art-the-loss)アプローチを交互に行うハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2024-07-08T00:21:42Z) - Learning with Imbalanced Noisy Data by Preventing Bias in Sample
Selection [82.43311784594384]
実世界のデータセットには、ノイズの多いラベルだけでなく、クラス不均衡も含まれている。
不均衡なデータセットにおけるノイズラベルに対処する,単純かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-17T10:34:53Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Combating Label Noise With A General Surrogate Model For Sample
Selection [84.61367781175984]
本稿では,視覚言語サロゲートモデルCLIPを用いて,雑音の多いサンプルを自動的にフィルタリングする手法を提案する。
提案手法の有効性を実世界および合成ノイズデータセットで検証した。
論文 参考訳(メタデータ) (2023-10-16T14:43:27Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - DiscrimLoss: A Universal Loss for Hard Samples and Incorrect Samples
Discrimination [28.599571524763785]
ラベルノイズ(すなわち不正なデータ)が与えられた場合、ディープニューラルネットワークはラベルノイズとモデル性能を徐々に記憶する。
この問題を解消するために,カリキュラム学習を提案し,学習サンプルを有意義な順序で順序付けすることで,モデル性能と一般化を向上させる。
論文 参考訳(メタデータ) (2022-08-21T13:38:55Z) - Confidence Adaptive Regularization for Deep Learning with Noisy Labels [2.0349696181833337]
ディープニューラルネットワークのノイズラベルに対する記憶効果に関する最近の研究は、ネットワークが正しくラベル付けされたトレーニングサンプルに最初に適合し、誤ってラベル付けされたサンプルを記憶することを示している。
そこで本研究では,この早期学習現象に触発されて,誤記サンプルの暗記を防止する新しい方法を提案する。
我々は,合成および実世界のデータセットに関する理論的解析と実験を行い,本手法が最先端の手法に匹敵する結果をもたらすことを示す。
論文 参考訳(メタデータ) (2021-08-18T15:51:25Z) - Transform consistency for learning with noisy labels [9.029861710944704]
単一のネットワークのみを用いてクリーンサンプルを同定する手法を提案する。
きれいなサンプルは元のイメージおよび変形したイメージのための一貫した予測に達することを好みます。
ノイズラベルの負の影響を軽減するために,オフラインのハードラベルとオンラインのソフトラベルを用いて分類損失を設計する。
論文 参考訳(メタデータ) (2021-03-25T14:33:13Z) - Robust and On-the-fly Dataset Denoising for Image Classification [72.10311040730815]
On-the-fly Data Denoising (ODD)は、間違ったラベルの例に対して堅牢だが、通常のトレーニングと比べて計算オーバーヘッドはほぼゼロである。
ODDはWebVisionやClothing1Mといった現実世界のデータセットを含む、幅広いデータセットで最先端の結果を達成することができる。
論文 参考訳(メタデータ) (2020-03-24T03:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。