論文の概要: Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object
Detector
- arxiv url: http://arxiv.org/abs/2402.03094v1
- Date: Mon, 5 Feb 2024 15:25:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 15:32:44.955290
- Title: Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object
Detector
- Title(参考訳): 拡張オープンセットオブジェクト検出器によるクロスドメインFewショットオブジェクト検出
- Authors: Yuqian Fu, Yu Wang, Yixuan Pan, Lian Huai, Xingyu Qiu, Zeyu Shangguan,
Tong Liu, Lingjie Kong, Yanwei Fu, Luc Van Gool, Xingqun Jiang
- Abstract要約: クロスドメイン小ショット物体検出(CD-FSOD)
オープンセット検出器は、オープンボキャブラリオブジェクト検出と従来の少数ショットオブジェクト検出の両方に優れている。
我々はCD-FSOD(CD-Vito)のための改良型クロスドメインビジョン変換器を提案する。
- 参考スコア(独自算出の注目度): 72.05791402494727
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the challenge of cross-domain few-shot object detection
(CD-FSOD), aiming to develop an accurate object detector for novel domains with
minimal labeled examples. While transformer-based open-set detectors e.g.,
DE-ViT~\cite{zhang2023detect} have excelled in both open-vocabulary object
detection and traditional few-shot object detection, detecting categories
beyond those seen during training, we thus naturally raise two key questions:
1) can such open-set detection methods easily generalize to CD-FSOD? 2) If no,
how to enhance the results of open-set methods when faced with significant
domain gaps? To address the first question, we introduce several metrics to
quantify domain variances and establish a new CD-FSOD benchmark with diverse
domain metric values. Some State-Of-The-Art (SOTA) open-set object detection
methods are evaluated on this benchmark, with evident performance degradation
observed across out-of-domain datasets. This indicates the failure of adopting
open-set detectors directly for CD-FSOD. Sequentially, to overcome the
performance degradation issue and also to answer the second proposed question,
we endeavor to enhance the vanilla DE-ViT. With several novel components
including finetuning, a learnable prototype module, and a lightweight attention
module, we present an improved Cross-Domain Vision Transformer for CD-FSOD
(CD-ViTO). Experiments show that our CD-ViTO achieves impressive results on
both out-of-domain and in-domain target datasets, establishing new SOTAs for
both CD-FSOD and FSOD. All the datasets, codes, and models will be released to
the community.
- Abstract(参考訳): 本稿では,最小限のラベル付きサンプルを用いた新規ドメイン向け高精度物体検出装置を開発することを目的とした,クロスドメインスショットオブジェクト検出(CD-FSOD)の課題に対処する。
de-vit~\cite{zhang2023detect} などの変圧器ベースのオープンセット検出器は、オープンボキャブラリーオブジェクト検出と従来の少数ショットオブジェクト検出の両方において優れているが、トレーニング中に見られるものを超えるカテゴリを検出することは、自然に2つの重要な疑問を提起する。
1) このような開集合検出法はCD-FSODに容易に一般化できるのか?
2) 有意なドメインギャップに直面した場合、オープンセットメソッドの結果をどのように向上させるか。
最初の問題に対処するために、ドメインの分散を定量化し、多様なドメインのメトリック値を持つ新しいCD-FSODベンチマークを確立するためのいくつかの指標を導入する。
State-Of-The-Art (SOTA) のオープンセットオブジェクト検出手法をこのベンチマークで評価した。
これはCD-FSODにオープンセット検出器を直接採用しなかったことを示している。
次に, 性能劣化問題を克服し, 第2の質問に答えるために, バニラD-ViTの強化に努める。
ファインタニング,学習可能なプロトタイプモジュール,軽量アテンションモジュールなどの新しいコンポーネントにより,CD-FSOD (CD-ViTO) 用のクロスドメインビジョントランスを改良した。
実験により、我々のCD-Vitoはドメイン外のターゲットデータセットとドメイン内のターゲットデータセットの両方で印象的な結果が得られ、CD-FSODとFSODの両方の新しいSOTAが確立された。
すべてのデータセット、コード、モデルはコミュニティにリリースされる予定だ。
関連論文リスト
- D2DF2WOD: Learning Object Proposals for Weakly-Supervised Object
Detection via Progressive Domain Adaptation [25.41133780678981]
D2DF2WODは完全な監視対象検出フレームワークである。
自然なイメージターゲットドメインを補うために、正確なオブジェクトローカライゼーションを付加した合成データを使用する。
提案手法は,最先端手法と比較してオブジェクト検出と局所化を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-02T18:58:03Z) - Exploiting Domain Transferability for Collaborative Inter-level Domain
Adaptive Object Detection [17.61278045720336]
オブジェクト検出のためのドメイン適応(DAOD)は、アノテーションなしで対象オブジェクトを検出できるため、最近注目を集めている。
従来の研究は、2段階検出器の部分的なレベルから抽出した特徴を、対向訓練によって整列させることに重点を置いていた。
本稿では,マルチスケール対応不確実性注意(MUA),転送可能領域ネットワーク(TRPN),動的インスタンスサンプリング(DIS)の3つのコンポーネントを用いた提案手法を提案する。
論文 参考訳(メタデータ) (2022-07-20T01:50:26Z) - Cross Domain Object Detection by Target-Perceived Dual Branch
Distillation [49.68119030818388]
クロスドメインオブジェクト検出は、現実的で挑戦的なタスクです。
本稿では,TDD(Target-perceived Dual-branch Distillation)フレームワークを提案する。
私たちのTDDは、すべてのベンチマークで最先端のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-05-03T03:51:32Z) - An Unsupervised Domain Adaptive Approach for Multimodal 2D Object
Detection in Adverse Weather Conditions [5.217255784808035]
本稿では、ソースとターゲットドメイン間のドメインギャップを埋めるために、教師なしのドメイン適応フレームワークを提案する。
天候の歪みをシミュレートするデータ拡張方式を用いて、ドメインの混乱を増し、ソースデータへの過度な適合を防止する。
DENSEデータセットで行った実験は、我々の手法がドメインギャップを大幅に軽減できることを示している。
論文 参考訳(メタデータ) (2022-03-07T18:10:40Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - DSDANet: Deep Siamese Domain Adaptation Convolutional Neural Network for
Cross-domain Change Detection [44.05317423742678]
クロスドメイン変化検出のための新しいディープ・サイムズ・ドメイン適応畳み込みニューラルネットワークアーキテクチャを提案する。
我々の知る限りでは、このようなドメイン適応に基づくディープネットワークが変更検出のために提案されたのは初めてである。
論文 参考訳(メタデータ) (2020-06-16T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。