論文の概要: Deep Active Re-Labeling: Toward Noise-Resilient Annotation Efficiency
- arxiv url: http://arxiv.org/abs/2606.08718v1
- Date: Sun, 07 Jun 2026 16:25:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.410273
- Title: Deep Active Re-Labeling: Toward Noise-Resilient Annotation Efficiency
- Title(参考訳): Deep Active Re-Labeling: To toward Noise-Resilient Annotation efficiency (特集 バイオサイバネティックスとバイオサイバネティックス)
- Authors: Md Abdullah Al Forhad, Weishi Shi,
- Abstract要約: 深層能動学習における人間のアノテーションエラーの影響を解析する。
DALのための人間のアノテーションノイズ問題に対処する枠組みを提案する。
- 参考スコア(独自算出の注目度): 7.146027549101716
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Deep Active Learning (DAL) effectively reduces human annotation costs, its efficacy is constrained by human annotation errors. This is because the data sampled for active learning is assumed to be highly informative for training. When human annotators introduce errors into this informative data at a certain rate, the active learning performance drops significantly and, in some cases, even exhibits worse outcomes than passive learning. In this paper, we first analyze the impact of human annotation errors in the DAL setting. Then we propose a framework to address the human annotation noise problem for DAL. Informed by human learning patterns, the core idea of our proposed solution involves allocating a portion of the human annotation budget to re-annotate data that has already been labeled. Previous theoretical work suggests that when the model possesses a certain level of ability to identify potentially noisy data, even re-labeling a small fraction of the data can effectively remove noise from the active training set. To achieve this, we implement two active noise sampling strategies to detect noise under different circumstances and allocate a part of the annotation budget to re-annotate these instances. Our approach imbues active learning with a revisiting and introspective behavior. Our experiments demonstrate that, under the same annotation budget, our method is more data-efficient and yields a relatively noise-free annotation dataset in the end.
- Abstract(参考訳): Deep Active Learning(DAL)は、人間のアノテーションコストを効果的に削減するが、その効果は人間のアノテーションエラーによって制限される。
これは、アクティブラーニングのためにサンプリングされたデータは、トレーニングに非常に有益であると推定されるためである。
人間のアノテータがこの情報的データに一定の速度で誤りを導入すると、アクティブな学習性能は著しく低下し、場合によっては受動的学習よりも悪い結果を示す。
本稿では,DAL設定における人間のアノテーションエラーの影響をまず分析する。
そこで本研究では,DALにおける人間のアノテーションノイズ問題に対処する枠組みを提案する。
人間の学習パターンにインフォームドされ、提案するソリューションの中核となるアイデアは、すでにラベル付け済みのデータを再アノテートするために、人間のアノテーション予算の一部を割り当てることである。
これまでの理論的研究は、モデルが潜在的なノイズのあるデータを特定できる一定のレベルの能力を持っている場合、少数のデータを再ラベルすることで、アクティブなトレーニングセットからノイズを効果的に除去することができることを示唆している。
そこで我々は2つのアクティブノイズサンプリング手法を実装し、異なる状況下でノイズを検知し、アノテーションの予算の一部をアノテートするために割り当てる。
我々のアプローチは、再考と内省的な行動によって活発な学習をもたらす。
我々の実験は、同じアノテーション予算の下では、よりデータ効率が良く、最後には比較的ノイズのないアノテーションデータセットが得られることを示した。
関連論文リスト
- Improving Noise Robustness through Abstractions and its Impact on Machine Learning [2.6563873893593826]
ノイズは機械学習(ML)手法の適用に大きな影響を与える学習理論の基本的な問題である。
本稿では,データ抽象化を用いてノイズを緩和する手法を提案する。
目標は、抽象化によって生成された情報の損失を通じて、モデルの性能に対するノイズの影響を減らすことである。
論文 参考訳(メタデータ) (2024-06-12T17:14:44Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Improved Algorithm for Deep Active Learning under Imbalance via Optimal Separation [15.571923343398657]
クラス不均衡は、機械学習のパフォーマンスが現実世界のアプリケーションにおけるマイノリティクラスに深刻な影響を与える。
DIRECTは,クラス分離境界を識別し,アノテーションの最も不確実な例を選択するアルゴリズムである。
本研究は,クラス不均衡とラベルノイズの両条件下でのアクティブラーニングの総合的研究である。
論文 参考訳(メタデータ) (2023-12-14T18:18:34Z) - Understanding and Mitigating the Label Noise in Pre-training on
Downstream Tasks [91.15120211190519]
本稿では、事前学習データセットにおけるノイズの性質を理解し、下流タスクへの影響を軽減することを目的とする。
雑音の悪影響を軽減するために特徴空間に適応する軽量ブラックボックスチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2023-09-29T06:18:15Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。