論文の概要: Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels
- arxiv url: http://arxiv.org/abs/2309.09742v1
- Date: Mon, 18 Sep 2023 13:08:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 13:21:16.690764
- Title: Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels
- Title(参考訳): 同じバウンディングボックスを2枚描ける?
繰り返しラベルを用いた物体検出における符号ノイズアノテーション
- Authors: David Tschirschwitz, Christian Benz, Morris Florek, Henrik Norderhus,
Benno Stein, Volker Rodehorst
- Abstract要約: そこで本研究では,基礎的真理推定手法に適合する新しい局所化アルゴリズムを提案する。
また,本アルゴリズムは,TexBiGデータセット上でのトレーニングにおいて,優れた性能を示す。
- 参考スコア(独自算出の注目度): 6.872072177648135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The reliability of supervised machine learning systems depends on the
accuracy and availability of ground truth labels. However, the process of human
annotation, being prone to error, introduces the potential for noisy labels,
which can impede the practicality of these systems. While training with noisy
labels is a significant consideration, the reliability of test data is also
crucial to ascertain the dependability of the results. A common approach to
addressing this issue is repeated labeling, where multiple annotators label the
same example, and their labels are combined to provide a better estimate of the
true label. In this paper, we propose a novel localization algorithm that
adapts well-established ground truth estimation methods for object detection
and instance segmentation tasks. The key innovation of our method lies in its
ability to transform combined localization and classification tasks into
classification-only problems, thus enabling the application of techniques such
as Expectation-Maximization (EM) or Majority Voting (MJV). Although our main
focus is the aggregation of unique ground truth for test data, our algorithm
also shows superior performance during training on the TexBiG dataset,
surpassing both noisy label training and label aggregation using Weighted Boxes
Fusion (WBF). Our experiments indicate that the benefits of repeated labels
emerge under specific dataset and annotation configurations. The key factors
appear to be (1) dataset complexity, the (2) annotator consistency, and (3) the
given annotation budget constraints.
- Abstract(参考訳): 教師付き機械学習システムの信頼性は、基底真理ラベルの精度と可用性に依存する。
しかし、ヒューマンアノテーションのプロセスはエラーを起こしやすいため、ノイズラベルの可能性をもたらし、これらのシステムの実用性を阻害する可能性がある。
ノイズラベルによるトレーニングは重要な考慮事項であるが,テストデータの信頼性は,結果の信頼性を確認する上でも重要である。
この問題に対処する一般的なアプローチは繰り返しラベリングであり、複数のアノテータが同じ例をラベル付けし、それらのラベルを組み合わせることで、真のラベルをよりよく見積もる。
本稿では,オブジェクト検出とインスタンス分割タスクに対して,確固とした基底真理推定手法を適用した新しいローカライゼーションアルゴリズムを提案する。
提案手法の重要な革新は,局所化タスクと分類タスクを組み合わせたタスクを分類のみの問題に変換する能力であり,期待最大化(EM)やマジョリティ投票(MJV)といった手法の適用を可能にする。
テストデータに対する一意な基礎的真理の集約に重点を置いていますが、アルゴリズムはtexbigデータセットのトレーニング中に優れたパフォーマンスを示し、重み付きボックス融合(wbf)を用いたノイズラベルトレーニングとラベルアグリゲーションを上回っています。
実験の結果,特定のデータセットやアノテーション設定の下で繰り返しラベルの利点が現れることがわかった。
主な要因は、(1)データセットの複雑さ、(2)アノテーションの一貫性、(3)与えられたアノテーション予算の制約である。
関連論文リスト
- Substituting Data Annotation with Balanced Updates and Collective Loss
in Multi-label Text Classification [19.592985329023733]
MLTC(Multi-label text classification)は、あるテキストに複数のラベルを割り当てるタスクである。
本報告では,MLTCの問題点を,ラベル数に比例して,利用可能な監視信号の大きさが線形であるアノテーションフリーおよび希少アノテーション設定で検討する。
提案手法は,(1)事前学習した言語モデルを用いて,入力テキストを事前ラベル候補の集合にマッピングし,(2)ラベル記述による署名付きラベル依存グラフの計算,(3)ラベル依存グラフに沿ったメッセージパスによる事前ラベル候補の更新を行う。
論文 参考訳(メタデータ) (2023-09-24T04:12:52Z) - Multi-Label Noise Transition Matrix Estimation with Label Correlations:
Theory and Algorithm [73.94839250910977]
ノイズの多いマルチラベル学習は、大規模な正確なラベルの収集によって生じる課題により、注目を集めている。
遷移行列の導入は、マルチラベルノイズをモデル化し、統計的に一貫したアルゴリズムの開発に役立つ。
そこで本稿では, アンカーポイントを必要とせずに, ラベル相関を利用した新しい推定器を提案する。
論文 参考訳(メタデータ) (2023-09-22T08:35:38Z) - Robust Assignment of Labels for Active Learning with Sparse and Noisy
Annotations [0.17188280334580192]
監視された分類アルゴリズムは、世界中の多くの現実の問題を解決するために使用される。
残念なことに、多くのタスクに対して良質なアノテーションを取得することは、実際に行うには不可能か、あるいはコストがかかりすぎます。
サンプル空間のラベルのない部分を利用する2つの新しいアノテーション統一アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-07-25T19:40:41Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Learning with Noisy Labels by Targeted Relabeling [52.0329205268734]
クラウドソーシングプラットフォームは、ディープニューラルネットワークをトレーニングするためのデータセット収集によく使用される。
本稿では,少数のアノテーションを予約して,高い確率でラベル付け可能なエラーを明示的に緩和する手法を提案する。
論文 参考訳(メタデータ) (2021-10-15T20:37:29Z) - Enhancing Label Correlation Feedback in Multi-Label Text Classification
via Multi-Task Learning [6.1538971100140145]
ラベル相関フィードバックを高めるために,マルチタスク学習を用いた新しい手法を提案する。
本稿では,ラベル相関学習を強化するための2つの補助ラベル共起予測タスクを提案する。
論文 参考訳(メタデータ) (2021-06-06T12:26:14Z) - EvidentialMix: Learning with Combined Open-set and Closed-set Noisy
Labels [30.268962418683955]
開集合ラベルと閉集合ラベルを組み合わせた雑音ラベル問題の新しい変種について検討する。
その結果,従来の最先端手法よりも優れた分類結果と特徴表現が得られた。
論文 参考訳(メタデータ) (2020-11-11T11:15:32Z) - Exploiting Context for Robustness to Label Noise in Active Learning [47.341705184013804]
本稿では,どのラベルが間違っているのかをシステムがどのように識別するか,ラベルノイズの負の影響を最小限に抑えるために,マルチクラスアクティブラーニングシステムをどのように適用できるか,といった課題に対処する。
我々は、これらの関係を符号化し、ノイズラベルが利用できる場合にグラフ上の新しい信念を得るために、ラベルなしデータのグラフィカルな表現を構築した。
これはシーン分類、アクティビティ分類、文書分類の3つの異なる応用で実証されている。
論文 参考訳(メタデータ) (2020-10-18T18:59:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。