論文の概要: Simplifying Source-Free Domain Adaptation for Object Detection: Effective Self-Training Strategies and Performance Insights
- arxiv url: http://arxiv.org/abs/2407.07586v1
- Date: Wed, 10 Jul 2024 12:18:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-11 16:51:55.692418
- Title: Simplifying Source-Free Domain Adaptation for Object Detection: Effective Self-Training Strategies and Performance Insights
- Title(参考訳): オブジェクト検出のためのソースフリードメイン適応の簡易化:効果的な自己学習戦略とパフォーマンス指標
- Authors: Yan Hao, Florent Forest, Olga Fink,
- Abstract要約: 本稿では,コンピュータビジョンにおけるオブジェクト検出のためのソースフリー領域適応に着目した。
最近の研究では、ソースフリーオブジェクト検出(SFOD)の様々なソリューションが提案されている。
- 参考スコア(独自算出の注目度): 8.725446812770791
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper focuses on source-free domain adaptation for object detection in computer vision. This task is challenging and of great practical interest, due to the cost of obtaining annotated data sets for every new domain. Recent research has proposed various solutions for Source-Free Object Detection (SFOD), most being variations of teacher-student architectures with diverse feature alignment, regularization and pseudo-label selection strategies. Our work investigates simpler approaches and their performance compared to more complex SFOD methods in several adaptation scenarios. We highlight the importance of batch normalization layers in the detector backbone, and show that adapting only the batch statistics is a strong baseline for SFOD. We propose a simple extension of a Mean Teacher with strong-weak augmentation in the source-free setting, Source-Free Unbiased Teacher (SF-UT), and show that it actually outperforms most of the previous SFOD methods. Additionally, we showcase that an even simpler strategy consisting in training on a fixed set of pseudo-labels can achieve similar performance to the more complex teacher-student mutual learning, while being computationally efficient and mitigating the major issue of teacher-student collapse. We conduct experiments on several adaptation tasks using benchmark driving datasets including (Foggy)Cityscapes, Sim10k and KITTI, and achieve a notable improvement of 4.7\% AP50 on Cityscapes$\rightarrow$Foggy-Cityscapes compared with the latest state-of-the-art in SFOD. Source code is available at https://github.com/EPFL-IMOS/simple-SFOD.
- Abstract(参考訳): 本稿では,コンピュータビジョンにおけるオブジェクト検出のためのソースフリー領域適応に着目した。
このタスクは、新しいドメインごとに注釈付きデータセットを取得するコストのため、挑戦的で、非常に実践的な関心事です。
最近の研究では、様々な特徴アライメント、正規化、擬似ラベル選択戦略を備えた教師学生アーキテクチャのバリエーションとして、ソースフリーオブジェクト検出(SFOD)の様々なソリューションが提案されている。
本研究は,複数の適応シナリオにおけるより複雑なSFOD法と比較して,より単純なアプローチとその性能について検討する。
本稿では,検出器バックボーンにおけるバッチ正規化層の重要性を強調し,バッチ統計のみを適応させることがSFODの強力なベースラインであることを示す。
本研究では、ソースフリー環境での強弱強化による平均教師の簡単な拡張として、ソースフリーなアンバイアスド・教師(SF-UT)を提案し、従来のSFOD手法よりも優れていることを示す。
さらに、固定された擬似ラベルのトレーニングからなるさらに単純な戦略は、より複雑な教師と学生の相互学習と同等のパフォーマンスを達成できると同時に、教師と学生の崩壊の大きな問題を減らし、計算的に効率的であることを示す。
我々は、(Foggy)Cityscapes、Sim10k、KITTIなどのベンチマーク駆動データセットを用いて、いくつかの適応タスクを実験し、最新のSFODと比較して、Cityscapes$\rightarrow$Foggy-Cityscapesの4.7\% AP50を顕著に改善した。
ソースコードはhttps://github.com/EPFL-IMOS/simple-SFODで入手できる。
関連論文リスト
- BoostAdapter: Improving Vision-Language Test-Time Adaptation via Regional Bootstrapping [64.8477128397529]
本稿では,テスト時間適応フレームワークを提案する。
我々は、インスタンスに依存しない履歴サンプルとインスタンスを意識したブースティングサンプルから特徴を検索するための軽量なキー値メモリを維持している。
理論的には,本手法の背後にある合理性を正当化し,アウト・オブ・ディストリビューションとクロスドメイン・データセットの両方において,その有効性を実証的に検証する。
論文 参考訳(メタデータ) (2024-10-20T15:58:43Z) - Source-Free Domain Adaptation for YOLO Object Detection [12.998403995812298]
本稿では、現実世界の視覚システム、特に単発検出器のYOLOファミリーに対するドメイン適応技術に焦点を当てる。
提案手法は,教師が学習対象の領域に固有の拡張を施した画像を受け取るためのフレームワークである。
ラベルのない平均教師アーキテクチャを用いた自己学習の課題は、ノイズやドリフトする擬似ラベルによる精度の急激な低下である。
論文 参考訳(メタデータ) (2024-09-25T01:22:10Z) - EMPL: A novel Efficient Meta Prompt Learning Framework for Few-shot Unsupervised Domain Adaptation [22.586094394391747]
本稿では,FS-UDAのためのメタプロンプト学習フレームワークを提案する。
このフレームワークでは、事前訓練されたCLIPモデルを機能学習ベースモデルとして使用しています。
5-way 1-shotでは少なくとも15.4%,5-way 5-shotでは8.7%の大幅な改善が得られた。
論文 参考訳(メタデータ) (2024-07-04T17:13:06Z) - Strong Baselines for Parameter Efficient Few-Shot Fine-tuning [50.83426196335385]
FSC (Few-shot Classification) は、事前訓練(メタトレーニング)フェーズの後にクラス毎にいくつかの例を与えられた新しいクラスを学習する。
近年の研究では、新しいテストクラスで事前訓練された視覚変換器(ViT)を微調整することが、FSCにとって強力なアプローチであることが示されている。
しかし、微調整のViTは、時間、計算、ストレージに費用がかかる。
これにより、Transformerのパラメータのごく一部だけを微調整するPEFT法が考案された。
論文 参考訳(メタデータ) (2023-04-04T16:14:39Z) - Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection [90.32180043449263]
最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
本稿では,HSSDA(Hierarchical Supervision and Shuffle Data Augmentation)の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-04-04T02:09:32Z) - CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。
本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文 参考訳(メタデータ) (2022-06-01T03:02:07Z) - Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。
計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。
また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文 参考訳(メタデータ) (2022-03-23T06:24:31Z) - FedSemi: An Adaptive Federated Semi-Supervised Learning Framework [23.90642104477983]
フェデレートラーニング(FL)は、データを共有し、プライバシーを漏らすことなく、機械学習モデルをコトレーニングするための効果的なテクニックとして登場した。
既存のFL法の多くは、教師付き設定に重点を置いて、ラベルなしデータの利用を無視している。
本稿では,FedSemiを提案する。FedSemiは,教師-学生モデルを用いてFLに整合性正則化を導入する新しい,適応的で汎用的なフレームワークである。
論文 参考訳(メタデータ) (2020-12-06T15:46:04Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。