論文の概要: S4OD: Semi-Supervised learning for Single-Stage Object Detection
- arxiv url: http://arxiv.org/abs/2204.04492v1
- Date: Sat, 9 Apr 2022 15:19:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 16:04:59.440514
- Title: S4OD: Semi-Supervised learning for Single-Stage Object Detection
- Title(参考訳): s4od:単段物体検出のための半教師付き学習
- Authors: Yueming Zhang, Xingxu Yao, Chao Liu, Feng Chen, Xiaolin Song, Tengfei
Xing, Runbo Hu, Hua Chai, Pengfei Xu, and Guoshan Zhang
- Abstract要約: 単段検出器は、極端に前景の階級不均衡に苦しむが、2段検出器は動かない。
半教師対象検出では、高品質な擬似ラベルのみを選択することで、2段階検出器が優れた性能を発揮する。
- 参考スコア(独自算出の注目度): 17.44592826610368
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-stage detectors suffer from extreme foreground-background class
imbalance, while two-stage detectors do not. Therefore, in semi-supervised
object detection, two-stage detectors can deliver remarkable performance by
only selecting high-quality pseudo labels based on classification scores.
However, directly applying this strategy to single-stage detectors would
aggravate the class imbalance with fewer positive samples. Thus, single-stage
detectors have to consider both quality and quantity of pseudo labels
simultaneously. In this paper, we design a dynamic self-adaptive threshold
(DSAT) strategy in classification branch, which can automatically select pseudo
labels to achieve an optimal trade-off between quality and quantity. Besides,
to assess the regression quality of pseudo labels in single-stage detectors, we
propose a module to compute the regression uncertainty of boxes based on
Non-Maximum Suppression. By leveraging only 10% labeled data from COCO, our
method achieves 35.0% AP on anchor-free detector (FCOS) and 32.9% on
anchor-based detector (RetinaNet).
- Abstract(参考訳): 単段検出器は極度のフォアグラウンドバックグラウンドクラス不均衡に苦しむが、2段検出器はそうではない。
したがって、半教師対象検出において、2段検出器は、分類スコアに基づいて高品質な擬似ラベルを選択するだけで優れた性能が得られる。
しかし、この戦略を単段検出器に直接適用すると、クラス不均衡はより少ない正のサンプルで悪化する。
したがって、単段検出器は擬似ラベルの品質と量を同時に考慮する必要がある。
本稿では,分類分野における動的自己適応しきい値(DSAT)戦略を設計し,擬似ラベルを自動的に選択し,品質と量の間の最適なトレードオフを実現する。
また,単段検出器における擬似ラベルの回帰品質を評価するために,非最大抑制に基づくボックスの回帰不確かさを計算するモジュールを提案する。
COCOからのラベル付きデータの10%しか利用できないため、この手法はアンカーフリー検出器(FCOS)で35.0%AP、アンカーベース検出器(RetinaNet)で32.9%APを達成した。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - Semi-Anchored Detector for One-Stage Object Detection [24.42034747738174]
標準の1段検出器は、分類と回帰の2つのタスクで構成されている。
ResNet-101をバックボーンとし、提案されたセミアンコール検出器はCOCOデータセット上で43.6%のmAPを達成する。
論文 参考訳(メタデータ) (2020-09-10T16:57:09Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。