論文の概要: Consistent Teacher Provides Better Supervision in Semi-supervised Object
Detection
- arxiv url: http://arxiv.org/abs/2209.01589v1
- Date: Sun, 4 Sep 2022 10:21:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 14:03:54.886389
- Title: Consistent Teacher Provides Better Supervision in Semi-supervised Object
Detection
- Title(参考訳): 半教師対象検出における教師の指導力の向上
- Authors: Xinjiang Wang, Xingyi Yang, Shilong Zhang, Yijiang Li, Litong Feng,
Shijie Fang, Chengqi Lyu, Kai Chen, Wayne Zhang
- Abstract要約: 現在の検出器は一般に3つの矛盾問題に悩まされている。
アダプティブアンカー割り当ては静的IoUベースの戦略を代用する。
我々は擬似ボックス閾値を動的に調整するためにガウス混合モデル(GMM)を採用する。
- 参考スコア(独自算出の注目度): 28.40887130075552
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this study, we dive deep into the unique challenges in semi-supervised
object detection~(SSOD). We observe that current detectors generally suffer
from 3 inconsistency problems. 1) Assignment inconsistency, that the
conventional assignment policy is sensitive to labeling noise. 2) Subtasks
inconsistency, where the classification and regression predictions are
misaligned at the same feature point. 3) Temporal inconsistency, that the
pseudo bboxes vary dramatically at different training steps. These issues lead
to inconsistent optimization objectives of the student network, thus
deteriorating performance and slowing down the model convergence. We,
therefore, propose a systematic solution, termed Consistent Teacher, to remedy
the above-mentioned challenges. First, adaptive anchor assignment substitutes
the static IoU-based strategy, which enables the student network to be
resistant to noisy psudo bboxes; Then we calibrate the subtask predictions by
designing a feature alignment module; Lastly, We adopt a Gaussian Mixture Model
(GMM) to dynamically adjust the pseudo-boxes threshold. Consistent Teacher
provides a new strong baseline on a large range of SSOD evaluations. It
achieves 40.0 mAP with ResNet-50 backbone given only 10% of annotated MS-COCO
data, which surpasses previous baselines using pseudo labels by around 4 mAP.
When trained on fully annotated MS-COCO with additional unlabeled data, the
performance further increases to 49.1 mAP. Our code will be open-sourced soon.
- Abstract(参考訳): 本研究では,半教師対象検出(SSOD)におけるユニークな課題を深く掘り下げる。
現在の検出器は一般に3つの矛盾問題に悩まされている。
1)従来の割当て方針が騒音のラベル付けに敏感であることに矛盾がある。
2) サブタスクの不整合: 分類と回帰の予測が同じ特徴点でミスアライメントされる。
3) 時間的不整合, 擬似bボックスは異なるトレーニングステップで劇的に変化する。
これらの問題は、学生ネットワークの不整合最適化目標をもたらし、性能を低下させ、モデルの収束を遅くする。
そこで我々は,上記の課題を解決すべく,一貫した教師という体系的な解決法を提案する。
まず,適応型アンカーアサインは静的IoUベースの戦略に代えて,学生ネットワークがノイズの多いプシュドボックスに耐性を持つようにし,次に,機能アライメントモジュールを設計してサブタスク予測を調整し,最後に擬似ボックス閾値を動的に調整するためにガウス混合モデル(GMM)を採用する。
Consistent Teacherは、幅広いSSOD評価に関する新しい強力なベースラインを提供する。
ResNet-50のバックボーンで40.0mAPを達成し、注釈付きMS-COCOデータの10%しか与えられていない。
完全な注釈付きMS-COCOにラベルなしのデータを追加すると、パフォーマンスはさらに49.1 mAPに向上する。
私たちのコードは近々オープンソース化される予定です。
関連論文リスト
- Gradient-based Sampling for Class Imbalanced Semi-supervised Object Detection [111.0991686509715]
半教師付き物体検出(SSOD)におけるクラス不均衡問題を,より困難なシナリオ下で検討する。
本稿では,2種類の確認バイアスの観点から,クラス不均衡問題に対処する,単純かつ効果的な勾配に基づくサンプリングフレームワークを提案する。
提案手法は,MS-COCO,MS-COCO,Object365,LVISの3種類のサブタスクにおいて,現行の非平衡物体検出器よりもクリアマージンの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-22T11:30:10Z) - Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and
Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。
既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。
本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-16T04:34:11Z) - Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection [90.32180043449263]
最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
本稿では,HSSDA(Hierarchical Supervision and Shuffle Data Augmentation)の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-04-04T02:09:32Z) - Consistent Diffusion Models: Mitigating Sampling Drift by Learning to be
Consistent [97.64313409741614]
本稿では, モデルが生成したデータ上での予測が時間とともに一定であることを示す, 両立性特性を強制することを提案する。
CIFAR-10の条件および非条件生成とAFHQとFFHQのベースライン改良について,本研究の新たな訓練目標が得られた。
論文 参考訳(メタデータ) (2023-02-17T18:45:04Z) - Efficient Teacher: Semi-Supervised Object Detection for YOLOv5 [2.2290171169275492]
一段アンカーベースの検出器は、高品質または柔軟な擬似ラベルを生成する構造を欠いている。
Dense Detectorは、YOLOv5にインスパイアされた高密度サンプリング技術でRetinaNetを拡張するベースラインモデルである。
Pseudo Label Assigner は Dense Detector からより洗練された擬似ラベルを使用する。
Epoch Adaptorは、安定的で効率的なエンドツーエンドの半教師付きトレーニングスケジュールを可能にする方法である。
論文 参考訳(メタデータ) (2023-02-15T10:40:19Z) - DSLA: Dynamic smooth label assignment for efficient anchor-free object
detection [18.043176234010517]
アンカーフリー検出器は、基本的にオブジェクト検出を密な分類と回帰として定式化する。
局所化の質を推定するために、個別の予測分岐を導入するのが一般的である。
分類と品質評価の実践を掘り下げると、以下の矛盾が観測される。
論文 参考訳(メタデータ) (2022-08-01T12:56:44Z) - Self-Supervised 3D Monocular Object Detection by Recycling Bounding
Boxes [3.3299316770988625]
本稿では, ランダムウィンドウをプレテキストタスクとしてラベル付けすることで, 自己教師付きバウンディングボックスリサイクルの確立について検討する。
また,mAP 3Dでは2~3%,BEVでは0.9~1.5%,SSLではベースラインスコアでは0.9~1.5%の改善が見られた。
論文 参考訳(メタデータ) (2022-06-25T21:48:43Z) - ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D
Object Detection [78.71826145162092]
本稿では,ST3D++という名前の自己学習手法を提案する。
擬似ラベル生成プロセスにハイブリット品質を意識した三重項メモリを組み込むことにより、生成された擬似ラベルの品質と安定性を向上させる。
モデルトレーニングの段階では、ソースデータ支援トレーニング戦略とカリキュラムデータ拡張ポリシーを提案する。
論文 参考訳(メタデータ) (2021-08-15T07:49:06Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。