論文の概要: Semi-DETR: Semi-Supervised Object Detection with Detection Transformers
- arxiv url: http://arxiv.org/abs/2307.08095v1
- Date: Sun, 16 Jul 2023 16:32:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 15:41:54.117631
- Title: Semi-DETR: Semi-Supervised Object Detection with Detection Transformers
- Title(参考訳): Semi-DETR: 検出変換器を用いた半監督対象検出
- Authors: Jiacheng Zhang, Xiangru Lin, Wei Zhang, Kuo Wang, Xiao Tan, Junyu Han,
Errui Ding, Jingdong Wang, Guanbin Li
- Abstract要約: 半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
- 参考スコア(独自算出の注目度): 105.45018934087076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We analyze the DETR-based framework on semi-supervised object detection
(SSOD) and observe that (1) the one-to-one assignment strategy generates
incorrect matching when the pseudo ground-truth bounding box is inaccurate,
leading to training inefficiency; (2) DETR-based detectors lack deterministic
correspondence between the input query and its prediction output, which hinders
the applicability of the consistency-based regularization widely used in
current SSOD methods. We present Semi-DETR, the first transformer-based
end-to-end semi-supervised object detector, to tackle these problems.
Specifically, we propose a Stage-wise Hybrid Matching strategy that combines
the one-to-many assignment and one-to-one assignment strategies to improve the
training efficiency of the first stage and thus provide high-quality pseudo
labels for the training of the second stage. Besides, we introduce a Crossview
Query Consistency method to learn the semantic feature invariance of object
queries from different views while avoiding the need to find deterministic
query correspondence. Furthermore, we propose a Cost-based Pseudo Label Mining
module to dynamically mine more pseudo boxes based on the matching cost of
pseudo ground truth bounding boxes for consistency training. Extensive
experiments on all SSOD settings of both COCO and Pascal VOC benchmark datasets
show that our Semi-DETR method outperforms all state-of-the-art methods by
clear margins. The PaddlePaddle version code1 is at
https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/semi_det/semi_detr.
- Abstract(参考訳): 半教師対象検出(SSOD)に関するDETRベースのフレームワークを解析し,(1)擬似接地構造境界ボックスが不正確な場合に1対1の割当て戦略が不正確なマッチングを発生させ,トレーニングの非効率化につながること,(2)DTRベースの検出器は入力クエリと予測出力間の決定論的対応を欠き,現在のSSOD法で広く使用されている一貫性に基づく正規化の適用性を妨げていることを観察する。
そこで本稿では,トランスフォーマーを用いた初のエンドツーエンドの半教師付き物体検出器であるsemi-detrを提案する。
具体的には,第1段階のトレーニング効率を向上させるために,1対1の課題と1対1の課題を組み合わせ,第2段階のトレーニングのための高品質な擬似ラベルを提供するステージワイドハイブリッドマッチング戦略を提案する。
さらに、異なるビューからオブジェクトクエリのセマンティックな特徴不変性を学習するクロスビュークエリ一貫性法を導入し、決定論的クエリ対応を見つける必要性を回避する。
さらに,一貫性トレーニングのための擬似基底真理バウンディングボックスのマッチングコストに基づいて,さらに多くの擬似ボックスを動的にマイニングするコストベースの擬似ラベルマイニングモジュールを提案する。
COCOとPascal VOCベンチマークのベンチマークデータセットのSSOD設定に関する大規模な実験は、Semi-DETR法がすべての最先端メソッドをクリアマージンで上回っていることを示している。
PaddlePaddleバージョンcode1はhttps://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/semi_det/semi_detrにある。
関連論文リスト
- Sparse Semi-DETR: Sparse Learnable Queries for Semi-Supervised Object Detection [12.417754433715903]
Sparse Semi-DETRは、トランスフォーマーをベースとした、エンドツーエンドの半教師付きオブジェクト検出ソリューションである。
Sparse Semi-DETR には Query Refinement Module が組み込まれており、オブジェクトクエリの品質を高め、小型で部分的に隠されたオブジェクトの検出能力を著しく改善している。
MS-COCOおよびPascal VOCオブジェクト検出ベンチマークでは、Sparse Semi-DETRは現在の最先端手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-04-02T10:22:23Z) - End-to-End Lane detection with One-to-Several Transformer [6.79236957488334]
O2SFormerはResNet18バックボーンのDETRよりも12.5倍高速に収束する。
ResNet50のバックボーンを持つO2SFormerは、CULaneデータセット上で77.83%のF1スコアを獲得し、既存のTransformerベースおよびCNNベースの検出器を上回っている。
論文 参考訳(メタデータ) (2023-05-01T06:07:11Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - W2N:Switching From Weak Supervision to Noisy Supervision for Object
Detection [64.10643170523414]
弱い監督からうるさい監督(W2N)に切り替える新しいパラダイムを持つ新しいWSODフレームワークを提案する。
ローカライズ適応モジュールでは、元の擬似接地構造における識別部分の割合を減らすために正規化損失を提案する。
我々のW2Nは、既存の純粋なWSODメソッドや転送学習メソッドよりも優れています。
論文 参考訳(メタデータ) (2022-07-25T12:13:48Z) - SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.64774488115299]
画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:49:51Z) - Mitigating the Mutual Error Amplification for Semi-Supervised Object
Detection [92.52505195585925]
擬似ラベルの修正機構を導入し,相互誤りの増幅を緩和するクロス・インストラクション(CT)手法を提案する。
他の検出器からの予測を直接擬似ラベルとして扱う既存の相互指導法とは対照的に,我々はラベル修正モジュール(LRM)を提案する。
論文 参考訳(メタデータ) (2022-01-26T03:34:57Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - RelationTrack: Relation-aware Multiple Object Tracking with Decoupled
Representation [3.356734463419838]
既存のオンラインマルチオブジェクトトラッキング(MOT)アルゴリズムは、しばしば2つのサブタスク、検出および再識別(ReID)で構成されています。
推論速度を高め、複雑さを減らすために、現在のメソッドは一般的にこれらの二重サブタスクを統一されたフレームワークに統合します。
学習した表現を検出特異的およびReID固有の埋め込みに分離するGlobal Context Disentangling(GCD)というモジュールを考案した。
この制約を解決するために,トランスコーダの強力な推論能力と変形可能な注意を組み合わせることで,誘導トランス(gte)と呼ばれるモジュールを開発した。
論文 参考訳(メタデータ) (2021-05-10T13:00:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。