論文の概要: CLDA-YOLO: Visual Contrastive Learning Based Domain Adaptive YOLO Detector
- arxiv url: http://arxiv.org/abs/2412.11812v1
- Date: Mon, 16 Dec 2024 14:25:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 13:56:46.309647
- Title: CLDA-YOLO: Visual Contrastive Learning Based Domain Adaptive YOLO Detector
- Title(参考訳): CLDA-YOLO:ビジュアルコントラスト学習に基づくドメイン適応型YOLO検出器
- Authors: Tianheng Qiu, Ka Lung Law, Guanghua Pan, Jufei Wang, Xin Gao, Xuan Huang, Hu Wei,
- Abstract要約: 非教師付きドメイン適応(UDA)アルゴリズムは、ドメインシフトの条件下でオブジェクト検出器の性能を著しく向上させることができる。
視覚コントラスト学習(CLDA-YOLO)に基づく教師なし領域適応型YOLO検出器を提案する。
- 参考スコア(独自算出の注目度): 10.419327930845922
- License:
- Abstract: Unsupervised domain adaptive (UDA) algorithms can markedly enhance the performance of object detectors under conditions of domain shifts, thereby reducing the necessity for extensive labeling and retraining. Current domain adaptive object detection algorithms primarily cater to two-stage detectors, which tend to offer minimal improvements when directly applied to single-stage detectors such as YOLO. Intending to benefit the YOLO detector from UDA, we build a comprehensive domain adaptive architecture using a teacher-student cooperative system for the YOLO detector. In this process, we propose uncertainty learning to cope with pseudo-labeling generated by the teacher model with extreme uncertainty and leverage dynamic data augmentation to asymptotically adapt the teacher-student system to the environment. To address the inability of single-stage object detectors to align at multiple stages, we utilize a unified visual contrastive learning paradigm that aligns instance at backbone and head respectively, which steadily improves the robustness of the detectors in cross-domain tasks. In summary, we present an unsupervised domain adaptive YOLO detector based on visual contrastive learning (CLDA-YOLO), which achieves highly competitive results across multiple domain adaptive datasets without any reduction in inference speed.
- Abstract(参考訳): 非教師付きドメイン適応(UDA)アルゴリズムは、ドメインシフトの条件下でのオブジェクト検出器の性能を著しく向上させ、広範囲なラベリングと再トレーニングの必要性を減らすことができる。
現在の領域適応型物体検出アルゴリズムは、主に2段検出器に適合し、YOLOのような単段検出器に直接適用した場合、最小限の改善をもたらす傾向がある。
UDA から YOLO 検出器を活用すべく, YOLO 検出器の教師-学生協調システムを用いた総合的なドメイン適応型アーキテクチャを構築した。
本研究では,教師モデルが生成した擬似ラベル処理を極めて不確実性に対処するための不確実性学習を提案する。
単一段階の物体検出装置が複数の段階で整列できないことを解決するため、バックボーンとヘッドにそれぞれインスタンスを整列させる統合視覚コントラスト学習パラダイムを用いて、クロスドメインタスクにおける検出器のロバスト性を着実に改善する。
本稿では,視覚コントラスト学習(CLDA-YOLO)に基づく教師なし領域適応型YOLO検出器を提案する。
関連論文リスト
- Source-Free Domain Adaptation for YOLO Object Detection [12.998403995812298]
本稿では、現実世界の視覚システム、特に単発検出器のYOLOファミリーに対するドメイン適応技術に焦点を当てる。
提案手法は,教師が学習対象の領域に固有の拡張を施した画像を受け取るためのフレームワークである。
ラベルのない平均教師アーキテクチャを用いた自己学習の課題は、ノイズやドリフトする擬似ラベルによる精度の急激な低下である。
論文 参考訳(メタデータ) (2024-09-25T01:22:10Z) - DATR: Unsupervised Domain Adaptive Detection Transformer with Dataset-Level Adaptation and Prototypical Alignment [7.768332621617199]
我々は、オブジェクト検出の教師なし領域適応のために、ドメイン適応検出TRansformer(DATR)と呼ばれる強力なDETRベースの検出器を導入する。
提案するDATRは,教師モデルによって生成された擬似ラベルを用いて,平均教師に基づく自己学習フレームワークを組み込んで,ドメインバイアスをさらに緩和する。
複数のドメイン適応シナリオにおいて,提案したDATRの性能と一般化性を示す実験を行った。
論文 参考訳(メタデータ) (2024-05-20T03:48:45Z) - Efficient Teacher: Semi-Supervised Object Detection for YOLOv5 [2.2290171169275492]
一段アンカーベースの検出器は、高品質または柔軟な擬似ラベルを生成する構造を欠いている。
Dense Detectorは、YOLOv5にインスパイアされた高密度サンプリング技術でRetinaNetを拡張するベースラインモデルである。
Pseudo Label Assigner は Dense Detector からより洗練された擬似ラベルを使用する。
Epoch Adaptorは、安定的で効率的なエンドツーエンドの半教師付きトレーニングスケジュールを可能にする方法である。
論文 参考訳(メタデータ) (2023-02-15T10:40:19Z) - SSDA-YOLO: Semi-supervised Domain Adaptive YOLO for Cross-Domain Object
Detection [27.02391566687007]
ドメイン適応オブジェクト検出(DAD)は、ドメイン間の不一致に起因する転送性能の劣化を軽減することを目的としている。
クロスドメイン検出性能を向上させるために,新しい半教師付きドメイン適応型YOLO(SSDA-YOLO)を提案する。
論文 参考訳(メタデータ) (2022-11-04T01:50:13Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - UDA-COPE: Unsupervised Domain Adaptation for Category-level Object Pose
Estimation [84.16372642822495]
我々は、textbfUDA-COPEと呼ばれるカテゴリレベルのオブジェクトポーズ推定のための教師なしドメイン適応(UDA)を提案する。
近年のマルチモーダルなUDA手法に触発された提案手法は,教師が指導する自己教師型学習手法を利用して,ターゲットドメインラベルを使わずにポーズ推定ネットワークを訓練する。
論文 参考訳(メタデータ) (2021-11-24T16:00:48Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - Domain Adaptive YOLO for One-Stage Cross-Domain Detection [4.596221278839825]
ドメイン適応型YOLO (DA-YOLO) は1段検出器のクロスドメイン性能を向上させるために提案される。
提案手法を,Cityscapes,KITTI,SIM10Kなどの一般的なデータセット上で評価する。
論文 参考訳(メタデータ) (2021-06-26T04:17:42Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Unsupervised Domain Adaptation for Spatio-Temporal Action Localization [69.12982544509427]
S時間動作の局所化はコンピュータビジョンにおいて重要な問題である。
本稿では、エンドツーエンドの教師なしドメイン適応アルゴリズムを提案する。
空間的特徴と時間的特徴を別々にあるいは共同的に適応した場合に,顕著な性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2020-10-19T04:25:10Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。