論文の概要: Selfish Evolution: Making Discoveries in Extreme Label Noise with the Help of Overfitting Dynamics
- arxiv url: http://arxiv.org/abs/2412.00077v1
- Date: Tue, 26 Nov 2024 18:51:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-08 08:18:02.335412
- Title: Selfish Evolution: Making Discoveries in Extreme Label Noise with the Help of Overfitting Dynamics
- Title(参考訳): 自己中心的進化:過度に適合する力学の助けを借りて極端ラベルノイズの発見
- Authors: Nima Sedaghat, Tanawan Chatchadanoraset, Colin Orion Chandler, Ashish Mahabal, Maryam Eslami,
- Abstract要約: 自己中心的進化(Selfish Evolution)は、破損したラベルを弱教師付きで検出し、修正することを可能にする。
我々はSupernova-huntingデータセットのメインタスクを評価するとともに、より標準的なMNISTデータセット上で効率を示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Motivated by the scarcity of proper labels in an astrophysical application, we have developed a novel technique, called Selfish Evolution, which allows for the detection and correction of corrupted labels in a weakly supervised fashion. Unlike methods based on early stopping, we let the model train on the noisy dataset. Only then do we intervene and allow the model to overfit to individual samples. The ``evolution'' of the model during this process reveals patterns with enough information about the noisiness of the label, as well as its correct version. We train a secondary network on these spatiotemporal ``evolution cubes'' to correct potentially corrupted labels. We incorporate the technique in a closed-loop fashion, allowing for automatic convergence towards a mostly clean dataset, without presumptions about the state of the network in which we intervene. We evaluate on the main task of the Supernova-hunting dataset but also demonstrate efficiency on the more standard MNIST dataset.
- Abstract(参考訳): 天体物理学的応用における適切なラベルの不足に動機づけられた我々は、弱教師付き方式で破損ラベルの検出と修正を可能にする「自己進化」と呼ばれる新しい手法を開発した。
早期停止に基づくメソッドとは異なり、ノイズの多いデータセットでモデルをトレーニングします。
その時のみ介入し、モデルが個々のサンプルに過度に適合することを許可します。
このプロセス中のモデルの ``evolution'' は、ラベルのノイズに関する十分な情報を持つパターンと、その正しいバージョンを明らかにします。
これらの時空間「進化立方体」上の二次ネットワークをトレーニングし、潜在的に破損したラベルを訂正する。
この手法をクローズドループ方式で取り入れることで、ネットワークの状態を前提にすることなく、ほとんどクリーンなデータセットへの自動収束を可能にする。
我々はSupernova-huntingデータセットのメインタスクを評価するとともに、より標準的なMNISTデータセット上で効率を示す。
関連論文リスト
- Learning with Noisy Labels by Adaptive Gradient-Based Outlier Removal [4.71154003227418]
本稿では,Adaptive GRAdient-based outlier removal を用いて,雑音のあるラベルで学習する新しい手法 AGRAを提案する。
本手法は,サンプルの集合勾配と個々のサンプル勾配を比較して,対応するサンプルがモデルに役立つかどうかを動的に決定する。
いくつかのデータセットに対する広範囲な評価はAGRAの有効性を示している。
論文 参考訳(メタデータ) (2023-06-07T15:10:01Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Learning with Noisy labels via Self-supervised Adversarial Noisy Masking [33.87292143223425]
対向雑音マスキングと呼ばれる新しいトレーニング手法を提案する。
入力データとラベルを同時に調整し、ノイズの多いサンプルが過度に収まらないようにする。
合成および実世界のノイズデータセットの両方でテストされる。
論文 参考訳(メタデータ) (2023-02-14T03:13:26Z) - Losses over Labels: Weakly Supervised Learning via Direct Loss
Construction [71.11337906077483]
プログラム可能な弱い監視は、機械学習のパラダイムとして成長している。
ラベルの中間ステップを経由することなく,直接損失を発生させるため,ラベルのロバスト・オーバー・ラベル(Losses over Labels, LoL)を提案する。
いくつかのベンチマークテキストおよび画像分類タスクにおいて、LoLは既存の弱い監督手法を改善していることを示す。
論文 参考訳(メタデータ) (2022-12-13T22:29:14Z) - Adapting to Online Label Shift with Provable Guarantees [137.89382409682233]
オンラインラベルシフトの問題を定式化し,検討する。
非定常性と監督の欠如は、この問題に取り組むことを困難にしている。
我々のアルゴリズムは最適な動的後悔を享受しており、性能が透かしの性質と競合していることを示している。
論文 参考訳(メタデータ) (2022-07-05T15:43:14Z) - Informative Pseudo-Labeling for Graph Neural Networks with Few Labels [12.83841767562179]
グラフニューラルネットワーク(GNN)は、グラフ上の半教師付きノード分類のための最先端の結果を得た。
非常に少数のレーベルでGNNを効果的に学習する方法の課題は、まだ解明されていない。
我々は、非常に少ないラベルを持つGNNの学習を容易にするために、InfoGNNと呼ばれる新しい情報的擬似ラベルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-20T01:49:30Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - From Synthetic to Real: Unsupervised Domain Adaptation for Animal Pose
Estimation [67.39635503744395]
動物のポーズ推定は近年注目を集めている重要な分野である。
既存の作品は、合成データのような他のアクセスしやすいドメインのデータから生成される擬似ラベルでこの問題を回避する。
合成データと実データ間の領域ギャップを低減するために,マルチスケールドメイン適応モジュール (MDAM) を設計する。
具体的には、内部粗更新ループにおける自己蒸留モジュールと外部微更新ループにおける平均教師を提案し、古いものを徐々に置き換える新しい擬似ラベルを生成する。
論文 参考訳(メタデータ) (2021-03-27T08:39:43Z) - Self-Supervised Noisy Label Learning for Source-Free Unsupervised Domain
Adaptation [87.60688582088194]
新規な自己監督雑音ラベル学習法を提案する。
本手法は最新の結果を容易に達成でき、他の手法を非常に大きなマージンで超えることができる。
論文 参考訳(メタデータ) (2021-02-23T10:51:45Z) - Improving Generalization of Deep Fault Detection Models in the Presence
of Mislabeled Data [1.3535770763481902]
ラベルノイズを用いた頑健なトレーニングのための新しい2段階フレームワークを提案する。
最初のステップでは、仮説空間の更新に基づいて、外れ値(ラベルのつかないサンプルを含む)を識別する。
第2のステップでは、識別されたアウトレイラとデータ拡張技術に基づいて、トレーニングデータを修正するための異なるアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-30T12:33:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。