論文の概要: Pseudo-Labeling Driven Refinement of Benchmark Object Detection Datasets via Analysis of Learning Patterns
- arxiv url: http://arxiv.org/abs/2506.00997v1
- Date: Sun, 01 Jun 2025 12:57:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.893723
- Title: Pseudo-Labeling Driven Refinement of Benchmark Object Detection Datasets via Analysis of Learning Patterns
- Title(参考訳): Pseudo-Labeling-Driven Refinement of Benchmark Object Detection Datasets by Analysis of Learning Patterns (特集:一般セッション)
- Authors: Min Je Kim, Muhammad Munsif, Altaf Hussain, Hikmat Yar, Sung Wook Baik,
- Abstract要約: 本報告では,MS-COCO の更新版である MJ-COCO について述べる。
提案手法は損失と勾配に基づく誤り検出から始まり,潜在的にラベルのずれや難解なサンプルを同定する。
この統合パイプラインは、手動でリラベルすることなく、スケーラブルで正確なアノテーションエラーの修正を可能にする。
- 参考スコア(独自算出の注目度): 14.267929358737073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Benchmark object detection (OD) datasets play a pivotal role in advancing computer vision applications such as autonomous driving, and surveillance, as well as in training and evaluating deep learning-based state-of-the-art detection models. Among them, MS-COCO has become a standard benchmark due to its diverse object categories and complex scenes. However, despite its wide adoption, MS-COCO suffers from various annotation issues, including missing labels, incorrect class assignments, inaccurate bounding boxes, duplicate labels, and group labeling inconsistencies. These errors not only hinder model training but also degrade the reliability and generalization of OD models. To address these challenges, we propose a comprehensive refinement framework and present MJ-COCO, a newly re-annotated version of MS-COCO. Our approach begins with loss and gradient-based error detection to identify potentially mislabeled or hard-to-learn samples. Next, we apply a four-stage pseudo-labeling refinement process: (1) bounding box generation using invertible transformations, (2) IoU-based duplicate removal and confidence merging, (3) class consistency verification via expert objects recognizer, and (4) spatial adjustment based on object region activation map analysis. This integrated pipeline enables scalable and accurate correction of annotation errors without manual re-labeling. Extensive experiments were conducted across four validation datasets: MS-COCO, Sama COCO, Objects365, and PASCAL VOC. Models trained on MJ-COCO consistently outperformed those trained on MS-COCO, achieving improvements in Average Precision (AP) and APS metrics. MJ-COCO also demonstrated significant gains in annotation coverage: for example, the number of small object annotations increased by more than 200,000 compared to MS-COCO.
- Abstract(参考訳): ベンチマークオブジェクト検出(OD)データセットは、自律運転や監視といったコンピュータビジョン応用の進展、さらにはディープラーニングに基づく最先端検出モデルのトレーニングと評価において、重要な役割を果たす。
それらの中で、MS-COCOは多様なオブジェクトカテゴリと複雑なシーンのために標準ベンチマークになっている。
しかし、広く採用されているにもかかわらず、MS-COCOは、ラベルの欠如、不正なクラス割り当て、不正確なバウンディングボックス、重複ラベル、グループラベルの不整合など、様々なアノテーションの問題に悩まされている。
これらの誤りはモデルの訓練を妨げるだけでなく、ODモデルの信頼性と一般化を低下させる。
これらの課題に対処するため、我々はMS-COCOの包括的な改良フレームワークと、MS-COCOの新たなアノテーション版であるMJ-COCOを提案する。
提案手法は損失と勾配に基づく誤り検出から始まり,潜在的にラベルのずれや難解なサンプルを同定する。
次に,(1)可逆変換を用いたバウンディングボックス生成,(2)IoUに基づく重複除去と信頼結合,(3)エキスパートオブジェクト認識器によるクラス整合性検証,(4)オブジェクト領域の活性化マップ解析に基づく空間調整を行う。
この統合パイプラインは、手動でリラベルすることなく、スケーラブルで正確なアノテーションエラーの修正を可能にする。
MS-COCO, Sama COCO, Objects365, PASCAL VOCの4つの検証データセットで実験を行った。
MJ-COCOでトレーニングされたモデルは、MS-COCOでトレーニングされたモデルよりも一貫して優れ、平均精度(AP)とAPSメトリクスの改善を実現した。
例えば、MS-COCOと比較して、小さなオブジェクトアノテーションの数が20万以上増えた。
関連論文リスト
- COIN: Confidence Score-Guided Distillation for Annotation-Free Cell Segmentation [2.5234274237739402]
提案するCOIN(Confidence score-guided Instance distillation)は、3つの重要なステップを持つ新しいアノテーションフリーフレームワークである。
COINは最適なトランスポートを持つ教師なしセマンティックセグメンテーションを通じてエラーのないインスタンスの存在に対する感度を高める。
接地真理アノテーションの代替を提供し、接地真理アノテーションの代替を提供する。
論文 参考訳(メタデータ) (2025-03-14T14:27:24Z) - Class-wise Autoencoders Measure Classification Difficulty And Detect Label Mistakes [22.45812577928658]
本稿では,個々のクラスで訓練されたオートエンコーダ間の再構成誤差の比率に基づいて,分類データセットを解析するための新しいフレームワークを提案する。
この分析フレームワークは、サンプル、クラス、およびデータセット全体のデータセットの効率的なキャラクタリゼーションを可能にする。
論文 参考訳(メタデータ) (2024-12-03T17:29:00Z) - Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。
この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。
セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文 参考訳(メタデータ) (2024-04-16T17:38:26Z) - Mixed Pseudo Labels for Semi-Supervised Object Detection [27.735659283870646]
本稿では,擬似ラベルデータに対するMixupとMosaicを組み合わせたMixPLを提案する。
MixPLは、様々な検出器の性能を一貫して改善し、COCO-StandardおよびCOCO-Fullベンチマーク上で、より高速なR-CNN、FCOS、DINOによる新しい最先端結果を得る。
論文 参考訳(メタデータ) (2023-12-12T06:35:27Z) - End-to-End Supervised Multilabel Contrastive Learning [38.26579519598804]
マルチラベル表現学習は、オブジェクトカテゴリ間のラベル依存やデータ関連の問題に関連付けられる難しい問題として認識されている。
近年の進歩は、モデルとデータ中心の視点からこれらの課題に対処している。
KMCLと呼ばれる新しいエンドツーエンドのトレーニングフレームワークを提案し、モデルとデータ中心の設計の欠点に対処する。
論文 参考訳(メタデータ) (2023-07-08T12:46:57Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - Unbiased Teacher for Semi-Supervised Object Detection [50.0087227400306]
SS-OD(Semi-Supervised Object Detection)を再検討し,SS-ODにおける擬似ラベルバイアス問題を特定する。
学生と徐々に進歩する教師を相互に利益ある方法で共同で訓練するシンプルで効果的なアプローチであるUnbiased Teacherを紹介します。
論文 参考訳(メタデータ) (2021-02-18T17:02:57Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。