論文の概要: Style-Adaptive Detection Transformer for Single-Source Domain Generalized Object Detection
- arxiv url: http://arxiv.org/abs/2504.20498v1
- Date: Tue, 29 Apr 2025 07:38:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.79258
- Title: Style-Adaptive Detection Transformer for Single-Source Domain Generalized Object Detection
- Title(参考訳): 単一ソース領域一般化オブジェクト検出のためのスタイル適応型検出変換器
- Authors: Jianhong Han, Yupei Wang, Liang Chen,
- Abstract要約: オブジェクト検出における単一ソースドメイン一般化(SDG)は、ソースドメインのデータのみを使用して検出器を開発することを目的としている。
ドメイン不変な特徴を抽出する際,検出器を誘導するオブジェクト認識型コントラスト学習モジュールを提案する。
実験は、5つの異なる気象シナリオにおけるSA-DETRの優れた性能と一般化能力を示す。
- 参考スコア(独自算出の注目度): 7.768332621617199
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-source Domain Generalization (SDG) in object detection aims to develop a detector using only data from a source domain that can exhibit strong generalization capability when applied to unseen target domains. Existing methods are built upon CNN-based detectors and primarily improve robustness by employing carefully designed data augmentation strategies integrated with feature alignment techniques. However, data augmentation methods have inherent drawbacks; they are only effective when the augmented sample distribution approximates or covers the unseen scenarios, thus failing to enhance generalization across all unseen domains. Furthermore, while the recent Detection Transformer (DETR) has demonstrated superior generalization capability in domain adaptation tasks due to its efficient global information extraction, its potential in SDG tasks remains unexplored. To this end, we introduce a strong DETR-based detector named the Style-Adaptive Detection Transformer (SA-DETR) for SDG in object detection. Specifically, we present a domain style adapter that projects the style representation of the unseen target domain into the training domain, enabling dynamic style adaptation. Then, we propose an object-aware contrastive learning module to guide the detector in extracting domain-invariant features through contrastive learning. By using object-aware gating masks to constrain feature aggregation in both spatial and semantic dimensions, this module achieves cross-domain contrast of instance-level features, thereby enhancing generalization. Extensive experiments demonstrate the superior performance and generalization capability of SA-DETR across five different weather scenarios. Code is released at https://github.com/h751410234/SA-DETR.
- Abstract(参考訳): オブジェクト検出における単一ソースドメイン一般化(SDG)は、未確認のターゲットドメインに適用した場合に強力な一般化能力を示すソースドメインのデータのみを用いて検出器を開発することを目的としている。
既存の手法はCNNベースの検出器上に構築されており、機能アライメント技術と統合されたデータ拡張戦略を慎重に設計することで、主にロバスト性を向上させる。
しかし、データ拡張法には固有の欠点があり、拡張されたサンプル分布が未確認のシナリオを近似またはカバーする場合にのみ有効であり、その結果、すべての未確認領域における一般化の強化に失敗する。
さらに、最近の検出変換器(DETR)は、その効率的なグローバル情報抽出により、ドメイン適応タスクにおいて優れた一般化能力を示したが、SDGタスクのポテンシャルは未探索のままである。
そこで本研究では,オブジェクト検出におけるSDGに対して,Style-Adaptive Detection Transformer (SA-DETR) と呼ばれる強力なDETRベースの検出器を導入する。
具体的には、目に見えないターゲットドメインのスタイル表現をトレーニングドメインに投影し、動的スタイル適応を可能にするドメインスタイルアダプタを提案する。
そこで本研究では,オブジェクト認識型コントラスト学習モジュールを提案する。
オブジェクト認識ゲーティングマスクを用いて空間次元と意味次元の両方の特徴集約を制約することにより、このモジュールはインスタンスレベルの特徴のクロスドメインコントラストを達成し、一般化を向上する。
大規模な実験は、5つの異なる気象シナリオにおけるSA-DETRの優れた性能と一般化能力を示す。
コードはhttps://github.com/h751410234/SA-DETRで公開されている。
関連論文リスト
- DG-DETR: Toward Domain Generalized Detection Transformer [8.762314897895175]
変圧器を用いた検出器のロバスト性を高めるために,DG-DETR(Domain Generalized Detection TRansformer)を導入する。
具体的には、オブジェクトクエリからドメインが引き起こすバイアスを除去する、ドメインに依存しない新しいクエリ選択戦略を提案する。
DG-DETRの有効性を実験的に検証した。
論文 参考訳(メタデータ) (2025-04-28T08:33:10Z) - RT-DATR:Real-time Unsupervised Domain Adaptive Detection Transformer with Adversarial Feature Learning [4.823481349001852]
実時間領域適応型検出変換器RT-DATRを提案する。
我々の手法は現在の最先端手法より優れている。
論文 参考訳(メタデータ) (2025-04-12T12:36:01Z) - Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。
擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。
実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文 参考訳(メタデータ) (2024-12-18T13:03:00Z) - DATR: Unsupervised Domain Adaptive Detection Transformer with Dataset-Level Adaptation and Prototypical Alignment [7.768332621617199]
我々は、オブジェクト検出の教師なし領域適応のために、ドメイン適応検出TRansformer(DATR)と呼ばれる強力なDETRベースの検出器を導入する。
提案するDATRは,教師モデルによって生成された擬似ラベルを用いて,平均教師に基づく自己学習フレームワークを組み込んで,ドメインバイアスをさらに緩和する。
複数のドメイン適応シナリオにおいて,提案したDATRの性能と一般化性を示す実験を行った。
論文 参考訳(メタデータ) (2024-05-20T03:48:45Z) - Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。
最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T15:25:32Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - Instance Relation Graph Guided Source-Free Domain Adaptive Object
Detection [79.89082006155135]
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、ドメインシフトの問題に取り組むための効果的なアプローチである。
UDAメソッドは、ターゲットドメインの一般化を改善するために、ソースとターゲット表現を整列させようとする。
Source-Free Adaptation Domain (SFDA)設定は、ソースデータへのアクセスを必要とせずに、ターゲットドメインに対してソーストレーニングされたモデルを適用することで、これらの懸念を軽減することを目的としている。
論文 参考訳(メタデータ) (2022-03-29T17:50:43Z) - Domain Generalisation for Object Detection under Covariate and Concept Shift [10.32461766065764]
ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-10T11:14:18Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - DA-DETR: Domain Adaptive Detection Transformer with Information Fusion [53.25930448542148]
DA-DETRは、ラベル付きソースドメインからラベルなしターゲットドメインへの効果的な転送のための情報融合を導入するドメイン適応型オブジェクト検出変換器である。
本稿では,CNN機能とトランスフォーマー機能を融合した新しいCNN-Transformer Blender(CTBlender)を提案する。
CTBlenderはTransformer機能を使用して、高レベルの意味情報と低レベルの空間情報が融合した複数のスケールでCNN機能を変調し、正確な物体識別と位置決めを行う。
論文 参考訳(メタデータ) (2021-03-31T13:55:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。