論文の概要: CDFormer: Cross-Domain Few-Shot Object Detection Transformer Against Feature Confusion
- arxiv url: http://arxiv.org/abs/2505.00938v1
- Date: Fri, 02 May 2025 00:46:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-05 17:21:19.876232
- Title: CDFormer: Cross-Domain Few-Shot Object Detection Transformer Against Feature Confusion
- Title(参考訳): CDFormer: 機能融合に反対するクロスドメインFew-Shotオブジェクト検出トランス
- Authors: Boyuan Meng, Xiaohan Zhang, Peilin Li, Zhe Wu, Yiming Li, Wenkai Zhao, Beinan Yu, Hui-Liang Shen,
- Abstract要約: クロスドメイン小ショットオブジェクト検出(CD-FSOD)は、クラスインスタンスに制限のある、異なるドメインにわたる新しいオブジェクトを検出することを目的としている。
本稿では,機能混乱に対するクロスドメインな小ショットオブジェクト検出トランスであるCDFormerを紹介する。
- 参考スコア(独自算出の注目度): 15.839369243656199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-domain few-shot object detection (CD-FSOD) aims to detect novel objects across different domains with limited class instances. Feature confusion, including object-background confusion and object-object confusion, presents significant challenges in both cross-domain and few-shot settings. In this work, we introduce CDFormer, a cross-domain few-shot object detection transformer against feature confusion, to address these challenges. The method specifically tackles feature confusion through two key modules: object-background distinguishing (OBD) and object-object distinguishing (OOD). The OBD module leverages a learnable background token to differentiate between objects and background, while the OOD module enhances the distinction between objects of different classes. Experimental results demonstrate that CDFormer outperforms previous state-of-the-art approaches, achieving 12.9% mAP, 11.0% mAP, and 10.4% mAP improvements under the 1/5/10 shot settings, respectively, when fine-tuned.
- Abstract(参考訳): クロスドメイン小ショットオブジェクト検出(CD-FSOD)は、クラスインスタンスに制限のある、異なるドメインにわたる新しいオブジェクトを検出することを目的としている。
オブジェクト-背景の混同やオブジェクト-オブジェクトの混同を含む機能混同は、クロスドメインと少数ショットの両方の設定において重大な課題をもたらす。
本稿では,これらの課題に対処するために,クロスドメインな複数ショットオブジェクト検出トランスフォーマであるCDFormerを紹介する。
この手法は2つの主要なモジュール(object-background distinguishing (OBD)とobject-ject distinguishing (OOD))を通して特徴の混乱に対処する。
OBDモジュールは学習可能なバックグラウンドトークンを利用してオブジェクトとバックグラウンドを区別し、OODモジュールは異なるクラスのオブジェクトの区別を強化する。
実験の結果、CDFormerは従来の最先端のアプローチよりも優れており、1/5/10ショット設定で12.9% mAP、11.0% mAP、10.4% mAPの改善が達成されている。
関連論文リスト
- Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。
最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T15:25:32Z) - Cross Domain Object Detection by Target-Perceived Dual Branch
Distillation [49.68119030818388]
クロスドメインオブジェクト検出は、現実的で挑戦的なタスクです。
本稿では,TDD(Target-perceived Dual-branch Distillation)フレームワークを提案する。
私たちのTDDは、すべてのベンチマークで最先端のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-05-03T03:51:32Z) - Decoupled Adaptation for Cross-Domain Object Detection [69.5852335091519]
クロスドメインオブジェクト検出は、オブジェクト分類よりも難しい。
D-adaptは4つのクロスドメインオブジェクト検出タスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-10-06T08:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。