論文の概要: ClipGrader: Leveraging Vision-Language Models for Robust Label Quality Assessment in Object Detection
- arxiv url: http://arxiv.org/abs/2503.02897v1
- Date: Mon, 03 Mar 2025 05:02:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-06 15:53:52.825381
- Title: ClipGrader: Leveraging Vision-Language Models for Robust Label Quality Assessment in Object Detection
- Title(参考訳): ClipGrader:オブジェクト検出におけるロバストラベル品質評価のための視覚言語モデルの活用
- Authors: Hong Lu, Yali Bian, Rahul C. Shah,
- Abstract要約: 本稿では,境界ボックスアノテーションの精度を評価するために,視覚言語モデルを活用した新しいアプローチであるClipGraderを紹介する。
ClipGraderは、人工的に乱されたバウンディングボックスを持つ修正オブジェクト検出データセットでテストされ、COCO上の91%の精度を1.8%の偽陽性率で達成した。
実験では、既存のCOCOアノテーションのエラーを識別するClipGraderの機能を示し、データセットの洗練の可能性を強調した。
- 参考スコア(独自算出の注目度): 1.4015334285802727
- License:
- Abstract: High-quality annotations are essential for object detection models, but ensuring label accuracy - especially for bounding boxes - remains both challenging and costly. This paper introduces ClipGrader, a novel approach that leverages vision-language models to automatically assess the accuracy of bounding box annotations. By adapting CLIP (Contrastive Language-Image Pre-training) to evaluate both class label correctness and spatial precision of bounding box, ClipGrader offers an effective solution for grading object detection labels. Tested on modified object detection datasets with artificially disturbed bounding boxes, ClipGrader achieves 91% accuracy on COCO with a 1.8% false positive rate. Moreover, it maintains 87% accuracy with a 2.1% false positive rate when trained on just 10% of the COCO data. ClipGrader also scales effectively to larger datasets such as LVIS, achieving 79% accuracy across 1,203 classes. Our experiments demonstrate ClipGrader's ability to identify errors in existing COCO annotations, highlighting its potential for dataset refinement. When integrated into a semi-supervised object detection (SSOD) model, ClipGrader readily improves the pseudo label quality, helping achieve higher mAP (mean Average Precision) throughout the training process. ClipGrader thus provides a scalable AI-assisted tool for enhancing annotation quality control and verifying annotations in large-scale object detection datasets.
- Abstract(参考訳): オブジェクト検出モデルには高品質なアノテーションが不可欠ですが、ラベルの正確性(特にバウンディングボックス)は、依然として困難かつコストがかかります。
本稿では,境界ボックスアノテーションの精度を自動的に評価するために,視覚言語モデルを活用した新しいアプローチであるClipGraderを紹介する。
ClipGraderは、CLIP(Contrastive Language- Image Pre-training)を適用して、クラスラベルの正しさとバウンディングボックスの空間精度の両方を評価することにより、オブジェクト検出ラベルのグレーディングに有効なソリューションを提供する。
ClipGraderは、人工的に乱されたバウンディングボックスを持つ修正オブジェクト検出データセットでテストされ、COCO上の91%の精度を1.8%の偽陽性率で達成した。
さらに、COCOデータの10%のトレーニングで2.1%の偽陽性率で87%の精度を維持している。
ClipGraderはまた、LVISのようなより大きなデータセットに効果的にスケールし、1,203クラスで79%の精度を達成した。
実験では、既存のCOCOアノテーションのエラーを識別するClipGraderの機能を示し、データセットの洗練の可能性を強調した。
半教師付きオブジェクト検出(SSOD)モデルに統合されると、ClipGraderは擬似ラベルの品質が容易に向上し、トレーニングプロセスを通じて高いmAP(平均精度)を達成する。
これによりClipGraderは、アノテーションの品質管理を強化し、大規模なオブジェクト検出データセットでアノテーションを検証する、スケーラブルなAI支援ツールを提供する。
関連論文リスト
- Estimating label quality and errors in semantic segmentation data via
any model [19.84626033109009]
ラベル品質を評価する手法について検討し、最も低いスコアのイメージを正しくラベル付けする可能性が低いことを示す。
これにより、高品質なトレーニング/評価データセットを保証するために、レビューするデータを優先順位付けすることが可能になる。
論文 参考訳(メタデータ) (2023-07-11T07:29:09Z) - Reliable Label Correction is a Good Booster When Learning with Extremely
Noisy Labels [65.79898033530408]
極音下での学習に明示的に取り組むために,LC-Boosterと呼ばれる新しい枠組みを導入する。
LC-Boosterは、ラベル補正をサンプル選択に組み込むことで、信頼性の高いラベル修正を通じて、より精製されたサンプルをトレーニングに利用することができる。
実験により、LC-Boosterはいくつかのノイズラベルベンチマークで最先端の結果を前進させることが示された。
論文 参考訳(メタデータ) (2022-04-30T07:19:03Z) - PseCo: Pseudo Labeling and Consistency Training for Semi-Supervised
Object Detection [42.75316070378037]
予測誘導ラベル割り当て(PLA)と正の確率整合投票(PCV)を含むNPL(Noisy Pseudo box Learning)を提案する。
ベンチマークでは PSEudo labeling と Consistency training (PseCo) が SOTA (Soft Teacher) の2.0, 1.8, 2.0 を1%, 5%, 10% で上回っている。
論文 参考訳(メタデータ) (2022-03-30T13:59:22Z) - Self-supervised Semi-supervised Learning for Data Labeling and Quality
Evaluation [10.483508279350195]
提案手法では,効率的なデータラベリングとアノテーション検証の課題に対処する。
本稿では,自己教師付き半教師付き学習を活用し,データラベリングや検証タスクの構築に利用する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-22T00:59:00Z) - To be Critical: Self-Calibrated Weakly Supervised Learning for Salient
Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。
擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。
十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-04T02:45:22Z) - Towards Reducing Labeling Cost in Deep Object Detection [61.010693873330446]
本稿では,検知器の不確実性と頑健性の両方を考慮した,アクティブラーニングのための統一的なフレームワークを提案する。
提案手法は, 確率分布のドリフトを抑えながら, 極めて確実な予測を擬似ラベル化することができる。
論文 参考訳(メタデータ) (2021-06-22T16:53:09Z) - End-to-End Semi-Supervised Object Detection with Soft Teacher [63.26266730447914]
本稿では,従来の複雑な多段階法とは対照的に,終端から終端までの半教師付き物体検出手法を提案する。
提案手法は, 種々のラベル付け比において, 従来手法よりも大きなマージンで性能を向上する。
最先端のSwin Transformerベースの物体検出器では、検出精度を+1.5 mAPで大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-06-16T17:59:30Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - Unbiased Teacher for Semi-Supervised Object Detection [50.0087227400306]
SS-OD(Semi-Supervised Object Detection)を再検討し,SS-ODにおける擬似ラベルバイアス問題を特定する。
学生と徐々に進歩する教師を相互に利益ある方法で共同で訓練するシンプルで効果的なアプローチであるUnbiased Teacherを紹介します。
論文 参考訳(メタデータ) (2021-02-18T17:02:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。