論文の概要: Semi-Supervised and Long-Tailed Object Detection with CascadeMatch
- arxiv url: http://arxiv.org/abs/2305.14813v1
- Date: Wed, 24 May 2023 07:09:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 18:53:46.481875
- Title: Semi-Supervised and Long-Tailed Object Detection with CascadeMatch
- Title(参考訳): CascadeMatchによる半監督・長期物体検出
- Authors: Yuhang Zang, Kaiyang Zhou, Chen Huang, Chen Change Loy
- Abstract要約: そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
- 参考スコア(独自算出の注目度): 91.86787064083012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper focuses on long-tailed object detection in the semi-supervised
learning setting, which poses realistic challenges, but has rarely been studied
in the literature. We propose a novel pseudo-labeling-based detector called
CascadeMatch. Our detector features a cascade network architecture, which has
multi-stage detection heads with progressive confidence thresholds. To avoid
manually tuning the thresholds, we design a new adaptive pseudo-label mining
mechanism to automatically identify suitable values from data. To mitigate
confirmation bias, where a model is negatively reinforced by incorrect
pseudo-labels produced by itself, each detection head is trained by the
ensemble pseudo-labels of all detection heads. Experiments on two long-tailed
datasets, i.e., LVIS and COCO-LT, demonstrate that CascadeMatch surpasses
existing state-of-the-art semi-supervised approaches -- across a wide range of
detection architectures -- in handling long-tailed object detection. For
instance, CascadeMatch outperforms Unbiased Teacher by 1.9 AP Fix on LVIS when
using a ResNet50-based Cascade R-CNN structure, and by 1.7 AP Fix when using
Sparse R-CNN with a Transformer encoder. We also show that CascadeMatch can
even handle the challenging sparsely annotated object detection problem.
- Abstract(参考訳): 本稿では,現実的な課題を呈する半教師付き学習環境における長期的対象検出に焦点を当てるが,文献ではほとんど研究されていない。
本研究ではカスケードマッチングと呼ばれる擬似ラベル型検出器を提案する。
この検出器はカスケードネットワークアーキテクチャを特徴とし,マルチステージ検出ヘッドとプログレッシブ信頼しきい値を有する。
しきい値の手動調整を避けるために,データから適切な値を自動識別する新しい適応型擬似ラベルマイニング機構を設計した。
全検出ヘッドのアンサンブル疑似ラベルにより、モデル自体が不正な擬似ラベルによって負に強化された確認バイアスを緩和する。
LVISとCOCO-LTという2つの長い尾を持つデータセットの実験では、CascadeMatchが、長い尾を持つオブジェクト検出の処理において、既存の最先端の半教師付きアプローチ(幅広い検出アーキテクチャ)を上回ることが示されている。
例えば、CascadeMatchは、ResNet50ベースのCascade R-CNN構造を使用する場合、LVISで1.9 AP Fix、TransformerエンコーダでSparse R-CNNを使用する場合1.7 AP Fixよりも優れている。
また,カスケードマッチングは難易度の低いオブジェクト検出問題にも対処できることを示した。
関連論文リスト
- Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - CAT: LoCalization and IdentificAtion Cascade Detection Transformer for
Open-World Object Detection [17.766859354014663]
オープンワールドオブジェクト検出には、既知のオブジェクトと未知のオブジェクトの両方を検出するために、既知のオブジェクトのデータからトレーニングされたモデルが必要である。
CAT: LoCalization and IdentificAtion Cascade Detection Transformerを提案する。
我々のモデルはOWOD, インクリメンタルオブジェクト検出(IOD), オープンセット検出といったタスクにおけるすべての指標において, 最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-05T09:11:16Z) - Double-Dot Network for Antipodal Grasp Detection [20.21384585441404]
本稿では,Double-Dot Network (DD-Net) という,対足足歩行検出のための新しい深層学習手法を提案する。
これは、経験的にプリセットされたアンカーに依存しない最近のアンカーフリーなオブジェクト検出フレームワークに従っている。
このような指先をローカライズするために効果的なCNNアーキテクチャを導入し、改良のための補助センターの助けを借りて、把握候補を正確かつ堅牢に推測する。
論文 参考訳(メタデータ) (2021-08-03T14:21:17Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。