論文の概要: Learning to Clean: Reinforcement Learning for Noisy Label Correction
- arxiv url: http://arxiv.org/abs/2511.19808v1
- Date: Tue, 25 Nov 2025 00:32:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.215178
- Title: Learning to Clean: Reinforcement Learning for Noisy Label Correction
- Title(参考訳): クリーンな学習:ノイズラベル補正のための強化学習
- Authors: Marzi Heidari, Hanping Zhang, Yuhong Guo,
- Abstract要約: 本稿では,雑音ラベル補正を強化学習問題として概念化する新しい枠組みを提案する。
提案手法であるReinforcement Learning for Noisy Label Correction (RLNLC)は,データとその関連ラベルを表す包括的状態空間を定義する。
RLNLCの有効性は、複数のベンチマークデータセットに対する広範な実験を通じて実証される。
- 参考スコア(独自算出の注目度): 25.643437301724365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The challenge of learning with noisy labels is significant in machine learning, as it can severely degrade the performance of prediction models if not addressed properly. This paper introduces a novel framework that conceptualizes noisy label correction as a reinforcement learning (RL) problem. The proposed approach, Reinforcement Learning for Noisy Label Correction (RLNLC), defines a comprehensive state space representing data and their associated labels, an action space that indicates possible label corrections, and a reward mechanism that evaluates the efficacy of label corrections. RLNLC learns a deep feature representation based policy network to perform label correction through reinforcement learning, utilizing an actor-critic method. The learned policy is subsequently deployed to iteratively correct noisy training labels and facilitate the training of the prediction model. The effectiveness of RLNLC is demonstrated through extensive experiments on multiple benchmark datasets, where it consistently outperforms existing state-of-the-art techniques for learning with noisy labels.
- Abstract(参考訳): ノイズの多いラベルで学習することの課題は、適切に対処しなければ予測モデルのパフォーマンスを著しく低下させるため、機械学習において重要である。
本稿では、雑音ラベル補正を強化学習(RL)問題として概念化する新しい枠組みを提案する。
提案手法であるReinforcement Learning for Noisy Label Correction (RLNLC)は、データとその関連ラベルを表す包括的な状態空間、ラベル修正の可能性を示すアクション空間、ラベル修正の有効性を評価する報酬機構を定義する。
RLNLCはディープ特徴表現に基づくポリシーネットワークを学習し、アクター批判的手法を用いて強化学習によりラベル補正を行う。
学習したポリシーはその後、繰り返し正しいノイズ訓練ラベルに展開され、予測モデルのトレーニングを容易にする。
RLNLCの有効性は、複数のベンチマークデータセットに対する広範な実験を通じて実証され、ノイズラベルによる学習において、既存の最先端技術よりも一貫して優れています。
関連論文リスト
- Adaptive Label Correction for Robust Medical Image Segmentation with Noisy Labels [18.868523370902338]
本稿では,雑音ラベルによる堅牢な医用画像分割のための平均教師に基づく適応ラベル補正フレームワークを提案する。
適応ラベルリファインメント機構は、複数の外乱バージョン間での差異を動的にキャプチャし、重み付けし、ノイズラベルの品質を高める。
また、サンプルレベルの不確実性に基づくラベル選択アルゴリズムを導入し、ネットワーク更新に高信頼なサンプルを優先順位付けする。
論文 参考訳(メタデータ) (2025-03-15T18:03:01Z) - Set a Thief to Catch a Thief: Combating Label Noise through Noisy Meta Learning [6.68999525326685]
ノイズラベル(LNL)からの学習は、ノイズデータセットを使用して高性能なディープモデルをトレーニングすることを目的としている。
本稿では,ラベルノイズの補正にノイズデータを用いる新しい雑音付きメタラベル補正フレームワークSTCTを提案する。
STCTは、96.9%のラベル修正と95.2%の分類性能をCIFAR-10で達成し、80%の対称ノイズを持つ。
論文 参考訳(メタデータ) (2025-02-22T05:58:01Z) - Inaccurate Label Distribution Learning with Dependency Noise [52.08553913094809]
本稿では,依存雑音に基づく不正確なラベル分布学習(DN-ILDL)フレームワークを導入し,ラベル分布学習におけるノイズによる課題に対処する。
本稿では,DN-ILDLがILDL問題に効果的に対処し,既存のLCL法より優れていることを示す。
論文 参考訳(メタデータ) (2024-05-26T07:58:07Z) - ERASE: Error-Resilient Representation Learning on Graphs for Label Noise
Tolerance [53.73316938815873]
本稿では, ERASE (Error-Resilient representation learning on graphs for lAbel noiSe tolerancE) という手法を提案する。
ERASEは、プロトタイプの擬似ラベルとプロパゲーションされた識別ラベルを組み合わせて、表現をエラーレジリエンスで更新する。
提案手法は, 広い雑音レベルにおいて, 複数のベースラインをクリアマージンで上回り, 高いスケーラビリティを享受できる。
論文 参考訳(メタデータ) (2023-12-13T17:59:07Z) - Unleashing the Potential of Regularization Strategies in Learning with
Noisy Labels [65.92994348757743]
クロスエントロピー損失を用いた単純なベースラインと、広く使われている正規化戦略を組み合わせることで、最先端の手法より優れていることを示す。
この結果から,正規化戦略の組み合わせは,ノイズラベルを用いた学習の課題に対処する上で,複雑なアルゴリズムよりも効果的であることが示唆された。
論文 参考訳(メタデータ) (2023-07-11T05:58:20Z) - Mitigating Label Noise through Data Ambiguation [9.51828574518325]
表現力の高い大型モデルは、誤ったラベルを記憶する傾向があるため、一般化性能を損なう。
本稿では,対象情報の「曖昧化」により,両手法の欠点に対処することを提案する。
より正確には、いわゆる超集合学習の枠組みを利用して、信頼度閾値に基づいて設定値の目標を構築する。
論文 参考訳(メタデータ) (2023-05-23T07:29:08Z) - Transductive CLIP with Class-Conditional Contrastive Learning [68.51078382124331]
雑音ラベル付き分類ネットワークをスクラッチから学習するための新しいフレームワークであるTransductive CLIPを提案する。
擬似ラベルへの依存を軽減するために,クラス条件のコントラスト学習機構を提案する。
アンサンブルラベルは、ノイズラベル付きディープニューラルネットワークのトレーニングを安定化するための擬似ラベル更新戦略として採用されている。
論文 参考訳(メタデータ) (2022-06-13T14:04:57Z) - Learning with Out-of-Distribution Data for Audio Classification [60.48251022280506]
我々は,OODインスタンスを破棄するよりも,特定のOODインスタンスを検出・復号化することで,学習に肯定的な影響を及ぼすことを示す。
提案手法は,畳み込みニューラルネットワークの性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-02-11T21:08:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。