論文の概要: Learning to Detect Label Errors by Making Them: A Method for Segmentation and Object Detection Datasets
- arxiv url: http://arxiv.org/abs/2508.17930v1
- Date: Mon, 25 Aug 2025 11:59:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.758955
- Title: Learning to Detect Label Errors by Making Them: A Method for Segmentation and Object Detection Datasets
- Title(参考訳): テーマ作成によるラベル誤り検出の学習--セグメンテーションとオブジェクト検出データセットの手法
- Authors: Sarina Penquitt, Tobias Riedlinger, Timo Heller, Markus Reischl, Matthias Rottmann,
- Abstract要約: 本稿では,オブジェクト検出,セマンティックセグメンテーション,インスタンスセグメンテーションデータセットにおけるラベルエラーを統一的に検出する手法を提案する。
実験では,提案手法のラベル誤り検出性能を,各タスク領域の様々なベースラインと最先端アプローチと比較した。
我々は、Cityscapesデータセットで特定された459個の実ラベルエラーをリリースし、Cityscapesにおける実ラベルエラー検出のベンチマークを提供する。
- 参考スコア(独自算出の注目度): 4.553529552666485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, detection of label errors and improvement of label quality in datasets for supervised learning tasks has become an increasingly important goal in both research and industry. The consequences of incorrectly annotated data include reduced model performance, biased benchmark results, and lower overall accuracy. Current state-of-the-art label error detection methods often focus on a single computer vision task and, consequently, a specific type of dataset, containing, for example, either bounding boxes or pixel-wise annotations. Furthermore, previous methods are not learning-based. In this work, we overcome this research gap. We present a unified method for detecting label errors in object detection, semantic segmentation, and instance segmentation datasets. In a nutshell, our approach - learning to detect label errors by making them - works as follows: we inject different kinds of label errors into the ground truth. Then, the detection of label errors, across all mentioned primary tasks, is framed as an instance segmentation problem based on a composite input. In our experiments, we compare the label error detection performance of our method with various baselines and state-of-the-art approaches of each task's domain on simulated label errors across multiple tasks, datasets, and base models. This is complemented by a generalization study on real-world label errors. Additionally, we release 459 real label errors identified in the Cityscapes dataset and provide a benchmark for real label error detection in Cityscapes.
- Abstract(参考訳): 近年,教師付き学習タスクのためのデータセットにおけるラベルエラーの検出とラベル品質の向上が,研究と産業の両方においてますます重要な目標となっている。
誤ったアノテートデータの結果には、モデルパフォーマンスの低下、ベンチマーク結果の偏り、全体的な精度の低下などがある。
現在の最先端ラベルエラー検出手法は、単一のコンピュータビジョンタスクにフォーカスすることが多く、従って特定のタイプのデータセット、例えば境界ボックスやピクセル単位のアノテーションを含む。
さらに、従来の手法は学習ベースではない。
本研究では,この研究ギャップを克服する。
本稿では,オブジェクト検出,セマンティックセグメンテーション,インスタンスセグメンテーションデータセットにおけるラベルエラーを統一的に検出する手法を提案する。
簡単に言うと、私たちのアプローチは、ラベルエラーを発生させることで検出することを学びます。
そして、上記のすべての一次タスクにおいてラベルエラーを検出することは、複合入力に基づいて、インスタンスセグメンテーション問題としてフレーム化される。
実験では,提案手法のラベル誤り検出性能を,複数のタスク,データセット,ベースモデルにまたがるラベル誤りのシミュレーションに基づいて,各タスク領域の様々なベースラインと最先端アプローチと比較した。
これは実世界のラベルエラーに関する一般化研究によって補完される。
さらに、Cityscapesデータセットで特定された459個の実ラベルエラーをリリースし、Cityscapesにおける実ラベルエラー検出のためのベンチマークを提供する。
関連論文リスト
- From Label Error Detection to Correction: A Modular Framework and Benchmark for Object Detection Datasets [4.864032555684836]
ラベルエラー訂正のための半自動フレームワークREC$checkmark$D(リチェック)を導入する。
現在のラベル誤り検出手法は,修正フレームワークと組み合わせることで,人間がアノテートボックスをスクラッチからアノテートするのに要する時間に数百のエラーを回復できることを示す。
この検証されたセットは、ラベルエラーの検出と修正のための新しい実世界のベンチマークとしてリリースされる。
論文 参考訳(メタデータ) (2025-08-06T10:03:05Z) - Estimating label quality and errors in semantic segmentation data via
any model [19.84626033109009]
ラベル品質を評価する手法について検討し、最も低いスコアのイメージを正しくラベル付けする可能性が低いことを示す。
これにより、高品質なトレーニング/評価データセットを保証するために、レビューするデータを優先順位付けすることが可能になる。
論文 参考訳(メタデータ) (2023-07-11T07:29:09Z) - Imprecise Label Learning: A Unified Framework for Learning with Various Imprecise Label Configurations [91.67511167969934]
imprecise label learning (ILL)は、様々な不正確なラベル構成で学習を統合するためのフレームワークである。
我々は、ILLが部分ラベル学習、半教師付き学習、雑音ラベル学習にシームレスに適応できることを実証した。
論文 参考訳(メタデータ) (2023-05-22T04:50:28Z) - Identifying Label Errors in Object Detection Datasets by Loss Inspection [4.442111891959355]
本稿では,オブジェクト検出データセットにおけるラベル誤り検出手法のベンチマークを紹介する。
そこで本研究では,軌道上でランダムに導入した4種類のラベルエラーと,良好なラベル付きオブジェクト検出データセットの試験セットをシミュレートする。
論文 参考訳(メタデータ) (2023-03-13T10:54:52Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Detecting Label Errors in Token Classification Data [22.539748563923123]
トークン分類データセットにラベルエラーを含む文を見つけるタスクについて検討する。
予測されたクラス確率に基づいてトークン/文をスコアする,11種類の簡単な手法について検討する。
異なるトークン分類モデルに適用した場合にラベルエラーを含む文を一貫して検出する,単純かつ効果的な手法を同定する。
論文 参考訳(メタデータ) (2022-10-08T05:14:22Z) - Automated Detection of Label Errors in Semantic Segmentation Datasets via Deep Learning and Uncertainty Quantification [5.279257531335345]
ピクセルワイドラベルを用いたセマンティックセグメンテーションデータセットにおけるラベル誤り検出手法を初めて提案する。
提案手法では,誤検出回数を制御しながら,ラベルエラーの大部分を検出することができる。
論文 参考訳(メタデータ) (2022-07-13T10:25:23Z) - Understanding Factual Errors in Summarization: Errors, Summarizers,
Datasets, Error Detectors [105.12462629663757]
本研究では、既存の9つのデータセットから事実性エラーアノテーションを集約し、基礎となる要約モデルに従ってそれらを階層化する。
本稿では,この階層化ベンチマークにおいて,最近のChatGPTベースの指標を含む最先端の事実性指標の性能を比較し,その性能が様々な種類の要約モデルで大きく異なることを示す。
論文 参考訳(メタデータ) (2022-05-25T15:26:48Z) - GuidedMix-Net: Semi-supervised Semantic Segmentation by Using Labeled
Images as Reference [90.5402652758316]
半教師付きセマンティックセマンティックセグメンテーションのための新しい手法である GuidedMix-Net を提案する。
ラベル付き情報を使用して、ラベルなしのインスタンスの学習をガイドする。
競合セグメンテーションの精度を達成し、mIoUを以前のアプローチに比べて+7$%大きく改善する。
論文 参考訳(メタデータ) (2021-12-28T06:48:03Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - Exploiting Context for Robustness to Label Noise in Active Learning [47.341705184013804]
本稿では,どのラベルが間違っているのかをシステムがどのように識別するか,ラベルノイズの負の影響を最小限に抑えるために,マルチクラスアクティブラーニングシステムをどのように適用できるか,といった課題に対処する。
我々は、これらの関係を符号化し、ノイズラベルが利用できる場合にグラフ上の新しい信念を得るために、ラベルなしデータのグラフィカルな表現を構築した。
これはシーン分類、アクティビティ分類、文書分類の3つの異なる応用で実証されている。
論文 参考訳(メタデータ) (2020-10-18T18:59:44Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - Object Detection as a Positive-Unlabeled Problem [78.2955013126312]
本稿では,未ラベル領域が負でなければならないという仮定を排除し,対象検出を正の未ラベル(PU)問題として扱うことを提案する。
提案するPU分類の損失は, PASCAL VOCやMS COCO, Visual GenomeやDeepLesionなど, ラベルの欠如により, 標準的なPN損失よりも優れていた。
論文 参考訳(メタデータ) (2020-02-11T20:49:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。