論文の概要: Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning
- arxiv url: http://arxiv.org/abs/2205.04042v1
- Date: Mon, 9 May 2022 05:08:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 15:45:45.301920
- Title: Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning
- Title(参考訳): インクリメンタルDETR:自己監督学習によるインクリメンタルFewショットオブジェクト検出
- Authors: Na Dong, Yongqiang Zhang, Mingli Ding, Gim Hee Lee
- Abstract要約: 本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
- 参考スコア(独自算出の注目度): 60.64535309016623
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Incremental few-shot object detection aims at detecting novel classes without
forgetting knowledge of the base classes with only a few labeled training data
from the novel classes. Most related prior works are on incremental object
detection that rely on the availability of abundant training samples per novel
class that substantially limits the scalability to real-world setting where
novel data can be scarce. In this paper, we propose the Incremental-DETR that
does incremental few-shot object detection via fine-tuning and self-supervised
learning on the DETR object detector. To alleviate severe over-fitting with few
novel class data, we first fine-tune the class-specific components of DETR with
self-supervision from additional object proposals generated using Selective
Search as pseudo labels. We further introduce a incremental few-shot
fine-tuning strategy with knowledge distillation on the class-specific
components of DETR to encourage the network in detecting novel classes without
catastrophic forgetting. Extensive experiments conducted on standard
incremental object detection and incremental few-shot object detection settings
show that our approach significantly outperforms state-of-the-art methods by a
large margin.
- Abstract(参考訳): インクリメンタル・ショット・オブジェクト検出は,新規クラスからのラベル付きトレーニングデータのみを用いて,基礎クラスの知識を忘れずに新規クラスを検出することを目的としている。
関連したほとんどの先行研究は、新しいクラス当たりの豊富なトレーニングサンプルの可用性に依存するインクリメンタルなオブジェクト検出であり、新しいデータが不足している実世界の設定にスケーラビリティを著しく制限している。
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・DETRを提案する。
まず、Selective Searchを擬似ラベルとして生成した追加のオブジェクト提案から、DETRのクラス固有のコンポーネントを自己スーパービジョンで微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
標準のインクリメンタルなオブジェクト検出とインクリメンタルな数ショットのオブジェクト検出設定に関する広範囲な実験は、我々のアプローチが最先端のメソッドを大きく上回っていることを示している。
関連論文リスト
- Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - Identification of Novel Classes for Improving Few-Shot Object Detection [12.013345715187285]
Few-shot Object Detection (FSOD) メソッドは、クラス毎に少数のトレーニングサンプルのみを使用して、堅牢なオブジェクト検出を実現することで、改善を提供する。
我々は、FSOD性能を向上させるためのトレーニング中に、未ラベルの新規物体を正のサンプルとして検出し、利用するための半教師付きアルゴリズムを開発した。
実験の結果,本手法は既存のSOTA FSOD法よりも有効であり,優れた結果が得られた。
論文 参考訳(メタデータ) (2023-03-18T14:12:52Z) - Scaling Novel Object Detection with Weakly Supervised Detection
Transformers [21.219817483091166]
Weakly Supervised Detection Transformerを提案する。これは大規模な事前学習データセットからWSODファインタニングへの効率的な知識伝達を可能にする。
提案手法は, 大規模オブジェクト検出データセットにおいて, 従来の最先端モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-07-11T21:45:54Z) - Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with
Attentive Feature Alignment [33.446875089255876]
Few-shot Object Detection (FSOD) は、少数の例でオブジェクトを検出することを目的としている。
本稿では,データ不足ベースクラスから学習したメタ知識を新しいクラスに転送することで,メタラーニングに基づくマイショットオブジェクト検出手法を提案する。
論文 参考訳(メタデータ) (2021-04-15T19:01:27Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Any-Shot Object Detection [81.88153407655334]
「アニーショット検出」とは、全く見えず、数発のカテゴリが推論中に同時に共起できる場所である。
我々は、ゼロショットと少数ショットの両方のオブジェクトクラスを同時に検出できる、統合された任意のショット検出モデルを提案する。
我々のフレームワークは、ゼロショット検出とFewショット検出タスクにのみ使用できる。
論文 参考訳(メタデータ) (2020-03-16T03:43:15Z) - Incremental Few-Shot Object Detection [96.02543873402813]
OpeN-ended Centre nEtは、いくつかの例でクラスオブジェクトの検出を漸進的に学習する検出器である。
ONCEはインクリメンタルな学習パラダイムを十分に尊重しており、新しいクラス登録では、数発のトレーニングサンプルを1回だけフォワードパスするだけでよい。
論文 参考訳(メタデータ) (2020-03-10T12:56:59Z) - Progressive Object Transfer Detection [84.48927705173494]
本稿では,新しいプログレッシブオブジェクト転送検出(POTD)フレームワークを提案する。
第一に、POTDは様々なドメインの様々なオブジェクトを効果的にプログレッシブな検出手順に活用することができる。
第2に、POTDは2つの微妙な転送段階、すなわち、LSTD(low-Shot Transfer Detection)とWSTD(Weakly Supervised Transfer Detection)から構成される。
論文 参考訳(メタデータ) (2020-02-12T00:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。