論文の概要: Consistent-Teacher: Towards Reducing Inconsistent Pseudo-targets in
Semi-supervised Object Detection
- arxiv url: http://arxiv.org/abs/2209.01589v3
- Date: Tue, 28 Mar 2023 14:15:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 19:45:59.897995
- Title: Consistent-Teacher: Towards Reducing Inconsistent Pseudo-targets in
Semi-supervised Object Detection
- Title(参考訳): consistent-teacher:半教師付き物体検出における一貫性のない疑似目標の削減に向けて
- Authors: Xinjiang Wang, Xingyi Yang, Shilong Zhang, Yijiang Li, Litong Feng,
Shijie Fang, Chengqi Lyu, Kai Chen, Wayne Zhang
- Abstract要約: 擬似ターゲットは正確な検出器の訓練を損なう。
生徒のトレーニングにノイズを注入し、過度な過度な問題を引き起こす。
不整合を低減するために,ConsistentTeacherと呼ばれる体系的ソリューションを提案する。
- 参考スコア(独自算出の注目度): 28.40887130075552
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this study, we dive deep into the inconsistency of pseudo targets in
semi-supervised object detection (SSOD). Our core observation is that the
oscillating pseudo-targets undermine the training of an accurate detector. It
injects noise into the student's training, leading to severe overfitting
problems. Therefore, we propose a systematic solution, termed
ConsistentTeacher, to reduce the inconsistency. First, adaptive anchor
assignment~(ASA) substitutes the static IoU-based strategy, which enables the
student network to be resistant to noisy pseudo-bounding boxes. Then we
calibrate the subtask predictions by designing a 3D feature alignment
module~(FAM-3D). It allows each classification feature to adaptively query the
optimal feature vector for the regression task at arbitrary scales and
locations. Lastly, a Gaussian Mixture Model (GMM) dynamically revises the score
threshold of pseudo-bboxes, which stabilizes the number of ground truths at an
early stage and remedies the unreliable supervision signal during training.
ConsistentTeacher provides strong results on a large range of SSOD evaluations.
It achieves 40.0 mAP with ResNet-50 backbone given only 10% of annotated
MS-COCO data, which surpasses previous baselines using pseudo labels by around
3 mAP. When trained on fully annotated MS-COCO with additional unlabeled data,
the performance further increases to 47.7 mAP. Our code is available at
\url{https://github.com/Adamdad/ConsistentTeacher}.
- Abstract(参考訳): 本研究では,半教師対象検出(SSOD)における疑似目標の不整合を深く掘り下げる。
我々の中核的な観察は、振動する擬似ターゲットが正確な検出器の訓練を損なうことである。
生徒のトレーニングにノイズを注入し、深刻な過度な問題を引き起こす。
そこで我々は,一貫性を損なうための体系的な解法であるconsistentteacherを提案する。
まず、適応アンカー代入~(ASA)は静的IoUベースの戦略を代用し、学生ネットワークはノイズの多い疑似バウンディングボックスに耐性を持つ。
次に,3次元特徴アライメントモジュール~(FAM-3D)を設計することにより,サブタスク予測の校正を行う。
これにより、各分類機能は任意のスケールと位置で回帰タスクの最適な特徴ベクトルを適応的にクエリできる。
最後に、ガウス混合モデル(GMM)は、擬似ボックスのスコア閾値を動的に修正し、早期の地上真実数を安定化し、訓練中に信頼できない監視信号を修正する。
ConsistentTeacherは、幅広いSSOD評価に対して強力な結果を提供する。
ResNet-50のバックボーンで40.0mAPを達成し、注釈付きMS-COCOデータの10%しか与えられていない。
完全な注釈付きMS-COCOにラベルなしのデータを追加すると、パフォーマンスはさらに47.7 mAPに向上する。
私たちのコードは \url{https://github.com/Adamdad/ConsistentTeacher} で利用可能です。
関連論文リスト
- Gradient-based Sampling for Class Imbalanced Semi-supervised Object Detection [111.0991686509715]
半教師付き物体検出(SSOD)におけるクラス不均衡問題を,より困難なシナリオ下で検討する。
本稿では,2種類の確認バイアスの観点から,クラス不均衡問題に対処する,単純かつ効果的な勾配に基づくサンプリングフレームワークを提案する。
提案手法は,MS-COCO,MS-COCO,Object365,LVISの3種類のサブタスクにおいて,現行の非平衡物体検出器よりもクリアマージンの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-22T11:30:10Z) - Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and
Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。
既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。
本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-16T04:34:11Z) - Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection [90.32180043449263]
最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
本稿では,HSSDA(Hierarchical Supervision and Shuffle Data Augmentation)の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-04-04T02:09:32Z) - Consistent Diffusion Models: Mitigating Sampling Drift by Learning to be
Consistent [97.64313409741614]
本稿では, モデルが生成したデータ上での予測が時間とともに一定であることを示す, 両立性特性を強制することを提案する。
CIFAR-10の条件および非条件生成とAFHQとFFHQのベースライン改良について,本研究の新たな訓練目標が得られた。
論文 参考訳(メタデータ) (2023-02-17T18:45:04Z) - Efficient Teacher: Semi-Supervised Object Detection for YOLOv5 [2.2290171169275492]
一段アンカーベースの検出器は、高品質または柔軟な擬似ラベルを生成する構造を欠いている。
Dense Detectorは、YOLOv5にインスパイアされた高密度サンプリング技術でRetinaNetを拡張するベースラインモデルである。
Pseudo Label Assigner は Dense Detector からより洗練された擬似ラベルを使用する。
Epoch Adaptorは、安定的で効率的なエンドツーエンドの半教師付きトレーニングスケジュールを可能にする方法である。
論文 参考訳(メタデータ) (2023-02-15T10:40:19Z) - DSLA: Dynamic smooth label assignment for efficient anchor-free object
detection [18.043176234010517]
アンカーフリー検出器は、基本的にオブジェクト検出を密な分類と回帰として定式化する。
局所化の質を推定するために、個別の予測分岐を導入するのが一般的である。
分類と品質評価の実践を掘り下げると、以下の矛盾が観測される。
論文 参考訳(メタデータ) (2022-08-01T12:56:44Z) - Self-Supervised 3D Monocular Object Detection by Recycling Bounding
Boxes [3.3299316770988625]
本稿では, ランダムウィンドウをプレテキストタスクとしてラベル付けすることで, 自己教師付きバウンディングボックスリサイクルの確立について検討する。
また,mAP 3Dでは2~3%,BEVでは0.9~1.5%,SSLではベースラインスコアでは0.9~1.5%の改善が見られた。
論文 参考訳(メタデータ) (2022-06-25T21:48:43Z) - ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D
Object Detection [78.71826145162092]
本稿では,ST3D++という名前の自己学習手法を提案する。
擬似ラベル生成プロセスにハイブリット品質を意識した三重項メモリを組み込むことにより、生成された擬似ラベルの品質と安定性を向上させる。
モデルトレーニングの段階では、ソースデータ支援トレーニング戦略とカリキュラムデータ拡張ポリシーを提案する。
論文 参考訳(メタデータ) (2021-08-15T07:49:06Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。