論文の概要: EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement
- arxiv url: http://arxiv.org/abs/2002.07421v1
- Date: Tue, 18 Feb 2020 08:04:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 20:19:14.037008
- Title: EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement
- Title(参考訳): EHSOD:カスケードリファインメントを用いたCAM-Guided End-to-end Hybrid-Supervised Object Detection
- Authors: Linpu Fang, Hang Xu, Zhili Liu, Sarah Parisot, Zhenguo Li
- Abstract要約: 本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
- 参考スコア(独自算出の注目度): 53.69674636044927
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detectors trained on fully-annotated data currently yield state of the
art performance but require expensive manual annotations. On the other hand,
weakly-supervised detectors have much lower performance and cannot be used
reliably in a realistic setting. In this paper, we study the hybrid-supervised
object detection problem, aiming to train a high quality detector with only a
limited amount of fullyannotated data and fully exploiting cheap data with
imagelevel labels. State of the art methods typically propose an iterative
approach, alternating between generating pseudo-labels and updating a detector.
This paradigm requires careful manual hyper-parameter tuning for mining good
pseudo labels at each round and is quite time-consuming. To address these
issues, we present EHSOD, an end-to-end hybrid-supervised object detection
system which can be trained in one shot on both fully and weakly-annotated
data. Specifically, based on a two-stage detector, we proposed two modules to
fully utilize the information from both kinds of labels: 1) CAMRPN module aims
at finding foreground proposals guided by a class activation heat-map; 2)
hybrid-supervised cascade module further refines the bounding-box position and
classification with the help of an auxiliary head compatible with image-level
data. Extensive experiments demonstrate the effectiveness of the proposed
method and it achieves comparable results on multiple object detection
benchmarks with only 30% fully-annotated data, e.g. 37.5% mAP on COCO. We will
release the code and the trained models.
- Abstract(参考訳): 現在、完全に注釈付けされたデータに基づいて訓練されたオブジェクト検出器は、高い手作業によるアノテーションを必要とする。
一方、弱い監視検出器は性能がはるかに低く、現実的な環境では確実に使用できない。
本稿では,限られた量の完全注釈データを用いて高品質な検出器を訓練し,画像レベルラベルを用いた安価なデータを完全に活用することを目的とした,ハイブリッド教師付き物体検出問題の検討を行う。
最先端の手法は通常、擬似ラベルの生成と検出器の更新を交互に行う反復的なアプローチを提案する。
このパラダイムでは、各ラウンドで優れた擬似ラベルをマイニングするために、慎重に手動のハイパーパラメータチューニングが必要です。
これらの問題に対処するために、EDSODは、完全および弱い注釈付きデータの両方でワンショットで訓練できる、エンドツーエンドのハイブリッド監視オブジェクト検出システムである。
具体的には,2段検出器を用いて,2種類のラベル情報を完全に活用する2つのモジュールを提案する。
1) CAMRPNモジュールは,クラスアクティベーションヒートマップによって導かれる事前提案を見つけることを目的としている。
2)ハイブリッド制御カスケードモジュールは,画像レベルのデータに適合する補助ヘッドを用いて,バウンディングボックスの位置と分類をさらに洗練する。
大規模な実験は提案手法の有効性を実証し、COCO上の37.5% mAPのような完全な注釈付きデータで、複数のオブジェクト検出ベンチマークで同等の結果を得る。
コードとトレーニングされたモデルをリリースします。
関連論文リスト
- Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Towards Few-Annotation Learning for Object Detection: Are
Transformer-based Models More Efficient ? [11.416621957617334]
本稿では,現在最先端のオブジェクト検出器であるDeformable DETRに適した半教師付き手法を提案する。
本手法はCOCOとPascal VOCの半教師付きオブジェクト検出ベンチマークで評価し,特にアノテーションが少ない場合,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-10-30T18:51:25Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Weakly-Supervised Salient Object Detection Using Point Supervison [17.88596733603456]
現在の最先端の精度検出モデルは、正確なピクセル単位のアノテーションの大規模なデータセットに大きく依存している。
本稿では,ポイント・インスペクタを用いた弱教師付きサルエント・オブジェクト検出手法を提案する。
我々の手法は、より強い監督力で訓練された従来の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-03-22T12:16:05Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。