論文の概要: Benchmarking Object Detectors with COCO: A New Path Forward
- arxiv url: http://arxiv.org/abs/2403.18819v1
- Date: Wed, 27 Mar 2024 17:59:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 15:50:03.317961
- Title: Benchmarking Object Detectors with COCO: A New Path Forward
- Title(参考訳): COCOによるオブジェクト検出のベンチマーク:新しいパスフォワード
- Authors: Shweta Singh, Aayan Yadav, Jitesh Jain, Humphrey Shi, Justin Johnson, Karan Desai,
- Abstract要約: Common Objects in Context (COCO)データセットは、過去10年にわたってオブジェクト検出器のベンチマークに役立っている。
高ラベルモデルが出現すると、COCOのこれらのエラーが、オブジェクト検出器を確実にベンチマークする上で、その有用性を妨げているかどうかを問う。
我々は,不正確なマスク境界,非排他的アノテーション付インスタンス,誤動作マスクなど,さまざまなタイプのエラーを明らかにする。
- 参考スコア(独自算出の注目度): 26.754253266204184
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Common Objects in Context (COCO) dataset has been instrumental in benchmarking object detectors over the past decade. Like every dataset, COCO contains subtle errors and imperfections stemming from its annotation procedure. With the advent of high-performing models, we ask whether these errors of COCO are hindering its utility in reliably benchmarking further progress. In search for an answer, we inspect thousands of masks from COCO (2017 version) and uncover different types of errors such as imprecise mask boundaries, non-exhaustively annotated instances, and mislabeled masks. Due to the prevalence of COCO, we choose to correct these errors to maintain continuity with prior research. We develop COCO-ReM (Refined Masks), a cleaner set of annotations with visibly better mask quality than COCO-2017. We evaluate fifty object detectors and find that models that predict visually sharper masks score higher on COCO-ReM, affirming that they were being incorrectly penalized due to errors in COCO-2017. Moreover, our models trained using COCO-ReM converge faster and score higher than their larger variants trained using COCO-2017, highlighting the importance of data quality in improving object detectors. With these findings, we advocate using COCO-ReM for future object detection research. Our dataset is available at https://cocorem.xyz
- Abstract(参考訳): Common Objects in Context (COCO)データセットは、過去10年にわたってオブジェクト検出器のベンチマークに役立っている。
すべてのデータセットと同様に、COCOはアノテーションの手順から生じる微妙なエラーと欠陥を含んでいる。
高パフォーマンスモデルの出現により、COCOのこれらのエラーが、その実用性を確実にベンチマークし、さらなる進歩を妨げているかどうかを問う。
回答を求めるため,COCO(2017年版)から数千のマスクを検査し,不正確なマスク境界,非排他的アノテーション付インスタンス,誤ラベル付きマスクなど,さまざまな種類のエラーを明らかにする。
COCOの普及により、これらの誤りを補正し、先行研究との連続性を維持することを選択する。
我々はCOCO-ReM(Refined Masks)を開発した。
我々は、50個の物体検出器を評価し、COCO-ReMにおいて、よりシャープなマスクを予測するモデルは、COCO-2017のエラーにより誤ってペナル化されていることを確認した。
さらに,COCO-ReMでトレーニングしたモデルは,COCO-2017でトレーニングした大規模モデルよりも早く収束し,スコアが高く,オブジェクト検出器の改善におけるデータ品質の重要性を強調した。
これらの結果から,COCO-ReMを将来の物体検出研究に活用することを提唱した。
私たちのデータセットはhttps://cocorem.xyz.comで公開されています。
関連論文リスト
- From COCO to COCO-FP: A Deep Dive into Background False Positives for COCO Detectors [8.3561487803637]
火災や煙の検知における誤報は、現実世界の応用において重要である。
COCO-FPはImageNet-1Kデータセットから派生した新しい評価データセットである。
標準および高度な物体検出器の評価は、クローズドセットとオープンセットの両方のシナリオにおいて、かなりの数の偽陽性を示す。
論文 参考訳(メタデータ) (2024-09-12T10:22:12Z) - Catastrophic Overfitting: A Potential Blessing in Disguise [51.996943482875366]
FAT(Fast Adversarial Training)は、敵の堅牢性向上に効果があるとして、研究コミュニティ内で注目を集めている。
既存のFATアプローチではCOの緩和が進んでいるが, クリーンサンプルの分類精度が低下するにつれて, 対向ロバスト性の上昇が生じる。
クリーンな例と逆向きな例に特徴アクティベーションの相違を利用して,COの根本原因を分析した。
我々は, モデル性能を高めることを目的として, 「攻撃難読化」を実現するためにCOを活用する。
論文 参考訳(メタデータ) (2024-02-28T10:01:44Z) - Mixed Pseudo Labels for Semi-Supervised Object Detection [27.735659283870646]
本稿では,擬似ラベルデータに対するMixupとMosaicを組み合わせたMixPLを提案する。
MixPLは、様々な検出器の性能を一貫して改善し、COCO-StandardおよびCOCO-Fullベンチマーク上で、より高速なR-CNN、FCOS、DINOによる新しい最先端結果を得る。
論文 参考訳(メタデータ) (2023-12-12T06:35:27Z) - COCO-O: A Benchmark for Object Detectors under Natural Distribution
Shifts [27.406639379618003]
COCO-Oは、COCOに基づく6種類の自然分布シフトに基づくテストデータセットである。
COCO-Oはトレーニングデータと大きな分散ギャップを持ち、より高速なR-CNN検出器で55.7%の性能低下をもたらす。
本稿では,検出器のアーキテクチャ設計,拡張および事前学習技術の最近のブレークスルーに対するロバスト性効果について検討する。
論文 参考訳(メタデータ) (2023-07-24T12:22:19Z) - Cut and Learn for Unsupervised Object Detection and Instance
Segmentation [65.43627672225624]
Cut-and-LeaRn(CutLER)は、教師なしオブジェクトの検出とセグメンテーションモデルをトレーニングするためのシンプルなアプローチである。
CutLERはゼロショット非監視検出器であり、11のベンチマークでAP50を2.7倍以上改善している。
論文 参考訳(メタデータ) (2023-01-26T18:57:13Z) - ECCV Caption: Correcting False Negatives by Collecting
Machine-and-Human-verified Image-Caption Associations for MS-COCO [47.61229316655264]
我々は,機械および人体アノテータに欠落した関連情報を供給することによって,拡張COCOバリデーション(ECCV)キャプションデータセットを構築した。
我々のデータセットは、元のMS-COCOと比較して、x3.6の正のイメージ・ツー・キャプション・アソシエーションとx8.5のキャプション・ツー・イメージ・アソシエーションを提供する。
その結果,COCO 1K R@K,COCO 5K R@K,CxC R@1などの既存のベンチマークは相関が強く,ECCV mAP@Rに移行するとランキングが変化することがわかった。
論文 参考訳(メタデータ) (2022-04-07T10:57:12Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z) - A Simple Semi-Supervised Learning Framework for Object Detection [55.95789931533665]
半教師付き学習(SSL)は、ラベルなしデータを用いた機械学習モデルの予測性能を改善する可能性がある。
本稿では,データ拡張戦略とともに,視覚オブジェクト検出のための簡易かつ効果的なSSLフレームワークSTACを提案する。
論文 参考訳(メタデータ) (2020-05-10T19:15:51Z) - Detection in Crowded Scenes: One Proposal, Multiple Predictions [79.28850977968833]
混み合ったシーンにおける高過度なインスタンスを検出することを目的とした,提案手法によるオブジェクト検出手法を提案する。
このアプローチの鍵は、各提案が以前の提案ベースのフレームワークの1つではなく、関連したインスタンスのセットを予測できるようにすることです。
我々の検出器は、CrowdHumanデータセットの挑戦に対して4.9%のAPゲインを得ることができ、CityPersonsデータセットでは1.0%$textMR-2$の改善がある。
論文 参考訳(メタデータ) (2020-03-20T09:48:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。