論文の概要: Towards the Identifiability in Noisy Label Learning: A Multinomial
Mixture Approach
- arxiv url: http://arxiv.org/abs/2301.01405v2
- Date: Sun, 16 Apr 2023 07:48:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 21:20:28.624239
- Title: Towards the Identifiability in Noisy Label Learning: A Multinomial
Mixture Approach
- Title(参考訳): 雑音ラベル学習における識別可能性に向けて:多項混合アプローチ
- Authors: Cuong Nguyen, Thanh-Toan Do, Gustavo Carneiro
- Abstract要約: 雑音ラベル(LNL)からの学習は、ディープラーニングにおいて重要な役割を果たす。
最も有望なLNLメソッドは、ノイズの多いアノテーションでデータセットからクリーンなラベルサンプルを特定することに依存する。
そこで本研究では,最寄りの住民を対象に,雑音ラベルの分布を推定することで,新たな雑音ラベルを自動的に生成する手法を提案する。
- 参考スコア(独自算出の注目度): 37.32107678838193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning from noisy labels (LNL) plays a crucial role in deep learning. The
most promising LNL methods rely on identifying clean-label samples from a
dataset with noisy annotations. Such an identification is challenging because
the conventional LNL problem, which assumes a single noisy label per instance,
is non-identifiable, i.e., clean labels cannot be estimated theoretically
without additional heuristics. In this paper, we aim to formally investigate
this identifiability issue using multinomial mixture models to determine the
constraints that make the problem identifiable. Specifically, we discover that
the LNL problem becomes identifiable if there are at least $2C - 1$ noisy
labels per instance, where $C$ is the number of classes. To meet this
requirement without relying on additional $2C - 2$ manual annotations per
instance, we propose a method that automatically generates additional noisy
labels by estimating the noisy label distribution based on nearest neighbours.
These additional noisy labels enable us to apply the Expectation-Maximisation
algorithm to estimate the posterior probabilities of clean labels, which are
then used to train the model of interest. We empirically demonstrate that our
proposed method is capable of estimating clean labels without any heuristics in
several label noise benchmarks, including synthetic, web-controlled, and
real-world label noises. Furthermore, our method performs competitively with
many state-of-the-art methods.
- Abstract(参考訳): 雑音ラベル(LNL)からの学習は、ディープラーニングにおいて重要な役割を果たす。
最も有望なLNLメソッドは、ノイズの多いアノテーションでデータセットからクリーンなラベルサンプルを特定することに依存する。
単一ノイズラベルを仮定する従来のLNL問題は、クリーンラベルが理論的には追加のヒューリスティックなしでは推定できないため、このような識別は困難である。
本稿では,多項混合モデルを用いてこの識別可能性問題を公式に検討し,問題を特定するための制約を決定することを目的とする。
具体的には、LNL の問題は、インスタンス毎に少なくとも 2C - 1$ のノイズラベルがあり、$C$ がクラスの数である場合、特定できる。
この要件を満たすため,各インスタンスに2ドル(2ドル)のアノテーションを追加することなく,近隣住民の雑音分布を推定することにより,新たなノイズラベルを自動的に生成する手法を提案する。
これらのノイズラベルを追加することで、期待最大化アルゴリズムを用いて、クリーンラベルの後方確率を推定し、興味のあるモデルをトレーニングすることができる。
提案手法は, 合成, ウェブ制御, 実世界のラベルノイズを含む複数のラベル評価ベンチマークにおいて, ヒューリスティクスを使わずにクリーンラベルを推定できることを示す。
さらに,本手法は多くの最先端手法と競合する。
関連論文リスト
- Extracting Clean and Balanced Subset for Noisy Long-tailed Classification [66.47809135771698]
そこで我々は,分布マッチングの観点から,クラスプロトタイプを用いた新しい擬似ラベリング手法を開発した。
手動で特定の確率尺度を設定することで、ノイズと長い尾を持つデータの副作用を同時に減らすことができる。
本手法は, クリーンなラベル付きクラスバランスサブセットを抽出し, ラベルノイズ付きロングテール分類において, 効果的な性能向上を実現する。
論文 参考訳(メタデータ) (2024-04-10T07:34:37Z) - Multi-Label Noise Transition Matrix Estimation with Label Correlations:
Theory and Algorithm [73.94839250910977]
ノイズの多いマルチラベル学習は、大規模な正確なラベルの収集によって生じる課題により、注目を集めている。
遷移行列の導入は、マルチラベルノイズをモデル化し、統計的に一貫したアルゴリズムの開発に役立つ。
そこで本稿では, アンカーポイントを必要とせずに, ラベル相関を利用した新しい推定器を提案する。
論文 参考訳(メタデータ) (2023-09-22T08:35:38Z) - Partial Label Supervision for Agnostic Generative Noisy Label Learning [18.29334728940232]
ノイズラベル学習は差別的アプローチと生成的アプローチの両方に取り組んできた。
本稿では,これらの課題に対処する生成ノイズラベル学習のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-08-02T14:48:25Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - BadLabel: A Robust Perspective on Evaluating and Enhancing Label-noise
Learning [113.8799653759137]
我々はBadLabelと呼ばれる新しいラベルノイズタイプを導入し、既存のLNLアルゴリズムの性能を大幅に劣化させることができる。
BadLabelは、標準分類に対するラベルフライング攻撃に基づいて開発されている。
そこで本稿では, 各エポックにおいてラベルを逆向きに摂動させ, クリーンかつノイズの多いラベルの損失値を再び識別可能にする頑健なLNL法を提案する。
論文 参考訳(メタデータ) (2023-05-28T06:26:23Z) - Instance-dependent Label Distribution Estimation for Learning with Label Noise [20.479674500893303]
雑音遷移行列(NTM)推定はラベル雑音による学習に有望な手法である。
本稿では、画像分類のためのノイズラベルから学習するためのインスタンス依存ラベル分布推定(ILDE)手法を提案する。
提案手法は, 合成ノイズであっても実雑音であっても, 競合する全ての手法より優れていることを示す。
論文 参考訳(メタデータ) (2022-12-16T10:13:25Z) - An Ensemble Noise-Robust K-fold Cross-Validation Selection Method for
Noisy Labels [0.9699640804685629]
大規模なデータセットには、ディープニューラルネットワーク(DNN)によって記憶されるような、ラベルのずれたサンプルが含まれている傾向があります。
本稿では, ノイズデータからクリーンなサンプルを効果的に選択するために, アンサンブルノイズ・ロバスト K-fold Cross-Validation Selection (E-NKCVS) を提案する。
我々は,ラベルが手動で異なる雑音比で破損した様々な画像・テキスト分類タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2021-07-06T02:14:52Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z) - A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。
人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文 参考訳(メタデータ) (2020-12-22T06:36:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。