論文の概要: Diffusion Domain Teacher: Diffusion Guided Domain Adaptive Object Detector
- arxiv url: http://arxiv.org/abs/2506.04211v1
- Date: Wed, 04 Jun 2025 17:56:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:14.509684
- Title: Diffusion Domain Teacher: Diffusion Guided Domain Adaptive Object Detector
- Title(参考訳): Diffusion Domain Teacher: Diffusion Guided Domain Adaptive Object Detector
- Authors: Boyong He, Yuxiang Ji, Zhuoyue Tan, Liaoni Wu,
- Abstract要約: 拡散に基づく生成モデルは、高品質で多様な画像を生成する際、顕著な能力を示している。
我々は、ソースドメイン上の凍結拡散モデルを用いて検出器を訓練し、それを教師モデルとして使用し、ラベルのないターゲットドメイン上で擬似ラベルを生成する。
本手法は6つのデータセットのベースラインと比較して平均mAP改善率21.2%を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detectors often suffer a decrease in performance due to the large domain gap between the training data (source domain) and real-world data (target domain). Diffusion-based generative models have shown remarkable abilities in generating high-quality and diverse images, suggesting their potential for extracting valuable feature from various domains. To effectively leverage the cross-domain feature representation of diffusion models, in this paper, we train a detector with frozen-weight diffusion model on the source domain, then employ it as a teacher model to generate pseudo labels on the unlabeled target domain, which are used to guide the supervised learning of the student model on the target domain. We refer to this approach as Diffusion Domain Teacher (DDT). By employing this straightforward yet potent framework, we significantly improve cross-domain object detection performance without compromising the inference speed. Our method achieves an average mAP improvement of 21.2% compared to the baseline on 6 datasets from three common cross-domain detection benchmarks (Cross-Camera, Syn2Real, Real2Artistic}, surpassing the current state-of-the-art (SOTA) methods by an average of 5.7% mAP. Furthermore, extensive experiments demonstrate that our method consistently brings improvements even in more powerful and complex models, highlighting broadly applicable and effective domain adaptation capability of our DDT. The code is available at https://github.com/heboyong/Diffusion-Domain-Teacher.
- Abstract(参考訳): オブジェクト検出器は、トレーニングデータ(ソースドメイン)と実世界のデータ(ターゲットドメイン)の間に大きなドメインギャップがあるため、パフォーマンスが低下することが多い。
拡散に基づく生成モデルは、高品質で多様な画像を生成する際、顕著な能力を示し、様々な領域から価値ある特徴を抽出する可能性を示唆している。
拡散モデルのクロスドメイン特徴表現を効果的に活用するために,本論文では,ソースドメイン上で凍結重量拡散モデルを用いて検出器を訓練し,それを教師モデルとして使用し,未ラベル対象ドメイン上で擬似ラベルを生成する。
このアプローチをDDT(Diffusion Domain Teacher)と呼ぶ。
この単純で強力なフレームワークを利用することで、推論速度を損なうことなく、ドメイン間オブジェクト検出性能を大幅に改善する。
提案手法は,3つの共通領域検出ベンチマーク(Cross-Camera,Syn2Real,Real2Artistic})から得られた6つのデータセットのベースラインと比較して平均mAPが21.2%向上し,現在のSOTA法を平均5.7%上回った。
さらに、より強力で複雑なモデルにおいても、我々の手法が一貫して改善をもたらし、DDTの広く適用可能で効果的なドメイン適応能力を強調している。
コードはhttps://github.com/heboyong/Diffusion-Domain-Teacherで入手できる。
関連論文リスト
- Generalized Diffusion Detector: Mining Robust Features from Diffusion Models for Domain-Generalized Detection [0.0]
オブジェクト検出のためのドメイン一般化(DG)は、目に見えないシナリオにおける検出器の性能を高めることを目的としている。
近年の拡散モデルは多様なシーン生成において顕著な機能を示した。
本稿では,拡散モデルの一般化能力を検出器が継承できる効率的な知識伝達フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-03T22:36:22Z) - CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D
Object Detection [14.063365469339812]
LiDARベースの3Dオブジェクト検出法は、ソース(またはトレーニング)データ配布の外部のターゲットドメインにうまく一般化しないことが多い。
画像のモダリティから視覚的セマンティックキューを活用する,CMDA (unsupervised domain adaptation) と呼ばれる新しい手法を提案する。
また、自己学習に基づく学習戦略を導入し、モデルが逆向きに訓練され、ドメイン不変の機能を生成する。
論文 参考訳(メタデータ) (2024-03-06T14:12:38Z) - Cross Domain Object Detection by Target-Perceived Dual Branch
Distillation [49.68119030818388]
クロスドメインオブジェクト検出は、現実的で挑戦的なタスクです。
本稿では,TDD(Target-perceived Dual-branch Distillation)フレームワークを提案する。
私たちのTDDは、すべてのベンチマークで最先端のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-05-03T03:51:32Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - Effective Label Propagation for Discriminative Semi-Supervised Domain
Adaptation [76.41664929948607]
半教師付き領域適応(SSDA)法は,大規模な画像分類タスクにおいて大きな可能性を示している。
本稿では、ドメイン間およびドメイン内セマンティック情報を効果的に伝達することにより、この問題に対処する新しい効果的な方法を提案する。
ソースコードと事前訓練されたモデルも間もなくリリースされる予定です。
論文 参考訳(メタデータ) (2020-12-04T14:28:19Z) - Adversarial Bipartite Graph Learning for Video Domain Adaptation [50.68420708387015]
ドメイン適応技術は,異なる領域間のモデルを適応させることに重点を置いているが,ビデオ認識領域ではめったに研究されていない。
近年,映像のソースと対象映像の表現を統一するために,対角学習を活用する視覚領域適応はビデオにはあまり効果がない。
本稿では,ソースとターゲットの相互作用を直接モデル化するAdversarial Bipartite Graph (ABG)学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-31T03:48:41Z) - Towards Fair Cross-Domain Adaptation via Generative Learning [50.76694500782927]
ドメイン適応(DA)は、よくラベル付けされたソースドメイン上でトレーニングされたモデルを、異なる分散に横たわる未ラベルのターゲットドメインに適応することを目的としています。
本研究では,新規な生成的Few-shot Cross-Domain Adaptation (GFCA) アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-03-04T23:25:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。