論文の概要: CDFormer: Cross-Domain Few-Shot Object Detection Transformer Against Feature Confusion
- arxiv url: http://arxiv.org/abs/2505.00938v1
- Date: Fri, 02 May 2025 00:46:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-05 17:21:19.876232
- Title: CDFormer: Cross-Domain Few-Shot Object Detection Transformer Against Feature Confusion
- Title(参考訳): CDFormer: 機能融合に反対するクロスドメインFew-Shotオブジェクト検出トランス
- Authors: Boyuan Meng, Xiaohan Zhang, Peilin Li, Zhe Wu, Yiming Li, Wenkai Zhao, Beinan Yu, Hui-Liang Shen,
- Abstract要約: クロスドメイン小ショットオブジェクト検出(CD-FSOD)は、クラスインスタンスに制限のある、異なるドメインにわたる新しいオブジェクトを検出することを目的としている。
本稿では,機能混乱に対するクロスドメインな小ショットオブジェクト検出トランスであるCDFormerを紹介する。
- 参考スコア(独自算出の注目度): 15.839369243656199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-domain few-shot object detection (CD-FSOD) aims to detect novel objects across different domains with limited class instances. Feature confusion, including object-background confusion and object-object confusion, presents significant challenges in both cross-domain and few-shot settings. In this work, we introduce CDFormer, a cross-domain few-shot object detection transformer against feature confusion, to address these challenges. The method specifically tackles feature confusion through two key modules: object-background distinguishing (OBD) and object-object distinguishing (OOD). The OBD module leverages a learnable background token to differentiate between objects and background, while the OOD module enhances the distinction between objects of different classes. Experimental results demonstrate that CDFormer outperforms previous state-of-the-art approaches, achieving 12.9% mAP, 11.0% mAP, and 10.4% mAP improvements under the 1/5/10 shot settings, respectively, when fine-tuned.
- Abstract(参考訳): クロスドメイン小ショットオブジェクト検出(CD-FSOD)は、クラスインスタンスに制限のある、異なるドメインにわたる新しいオブジェクトを検出することを目的としている。
オブジェクト-背景の混同やオブジェクト-オブジェクトの混同を含む機能混同は、クロスドメインと少数ショットの両方の設定において重大な課題をもたらす。
本稿では,これらの課題に対処するために,クロスドメインな複数ショットオブジェクト検出トランスフォーマであるCDFormerを紹介する。
この手法は2つの主要なモジュール(object-background distinguishing (OBD)とobject-ject distinguishing (OOD))を通して特徴の混乱に対処する。
OBDモジュールは学習可能なバックグラウンドトークンを利用してオブジェクトとバックグラウンドを区別し、OODモジュールは異なるクラスのオブジェクトの区別を強化する。
実験の結果、CDFormerは従来の最先端のアプローチよりも優れており、1/5/10ショット設定で12.9% mAP、11.0% mAP、10.4% mAPの改善が達成されている。
関連論文リスト
- Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。
最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T15:25:32Z) - HEAP: Unsupervised Object Discovery and Localization with Contrastive
Grouping [29.678756772610797]
教師なしオブジェクトの発見と位置決めは、監督なしで画像内のオブジェクトを検出し、セグメント化することを目的としている。
近年の取り組みは、自己監督型トランスフォーマー機能を利用して、有能な前景物体を識別する顕著な可能性を実証している。
これらの問題に対処するために、Herarchical mErging framework via contrAstive grouPing (HEAP) を紹介する。
論文 参考訳(メタデータ) (2023-12-29T06:46:37Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - Cross Domain Object Detection by Target-Perceived Dual Branch
Distillation [49.68119030818388]
クロスドメインオブジェクト検出は、現実的で挑戦的なタスクです。
本稿では,TDD(Target-perceived Dual-branch Distillation)フレームワークを提案する。
私たちのTDDは、すべてのベンチマークで最先端のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-05-03T03:51:32Z) - Multi-Granularity Alignment Domain Adaptation for Object Detection [33.32519045960187]
ドメイン適応型オブジェクト検出は、ソースドメインとターゲットドメインの間に特有のデータ分布があるため、難しい。
ドメイン不変な特徴学習に向けた多粒度アライメントに基づくオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-31T09:05:06Z) - Decoupled Adaptation for Cross-Domain Object Detection [69.5852335091519]
クロスドメインオブジェクト検出は、オブジェクト分類よりも難しい。
D-adaptは4つのクロスドメインオブジェクト検出タスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-10-06T08:43:59Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。