論文の概要: CFA: Constraint-based Finetuning Approach for Generalized Few-Shot
Object Detection
- arxiv url: http://arxiv.org/abs/2204.05220v1
- Date: Mon, 11 Apr 2022 16:04:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 16:48:51.691714
- Title: CFA: Constraint-based Finetuning Approach for Generalized Few-Shot
Object Detection
- Title(参考訳): CFA:一般化Few-Shotオブジェクト検出のための制約に基づくファインタニング手法
- Authors: Karim Guirguis, Ahmed Hendawy, George Eskandar, Mohamed Abdelsamad,
Matthias Kayser, Juergen Beyerer
- Abstract要約: 一般化された小ショットオブジェクト検出(G-FSOD)は、これまで見られたベースクラスを忘れずにFSODに取り組むことを目的としている。
CFAは、A-GEM(Average Gradient Episodic Memory)という連続的な学習法をG-FSODに適応させる。
提案手法は,従来のFSOD法とG-FSOD法を基本課題に軽微な劣化を伴う新しい課題において上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot object detection (FSOD) seeks to detect novel categories with
limited data by leveraging prior knowledge from abundant base data. Generalized
few-shot object detection (G-FSOD) aims to tackle FSOD without forgetting
previously seen base classes and, thus, accounts for a more realistic scenario,
where both classes are encountered during test time. While current FSOD methods
suffer from catastrophic forgetting, G-FSOD addresses this limitation yet
exhibits a performance drop on novel tasks compared to the state-of-the-art
FSOD. In this work, we propose a constraint-based finetuning approach (CFA) to
alleviate catastrophic forgetting, while achieving competitive results on the
novel task without increasing the model capacity. CFA adapts a continual
learning method, namely Average Gradient Episodic Memory (A-GEM) to G-FSOD.
Specifically, more constraints on the gradient search strategy are imposed from
which a new gradient update rule is derived, allowing for better knowledge
exchange between base and novel classes. To evaluate our method, we conduct
extensive experiments on MS-COCO and PASCAL-VOC datasets. Our method
outperforms current FSOD and G-FSOD approaches on the novel task with minor
degeneration on the base task. Moreover, CFA is orthogonal to FSOD approaches
and operates as a plug-and-play module without increasing the model capacity or
inference time.
- Abstract(参考訳): Few-shot Object Detection (FSOD)は、豊富なベースデータから事前の知識を活用して、限られたデータで新しいカテゴリを検出する。
一般化された少数ショットオブジェクト検出(g-fsod)は、これまで見てきたベースクラスを忘れずにfsodに取り組むことを目的としている。
現在のFSODメソッドは破滅的な忘れ込みに悩まされているが、G-FSODはこの制限に対処する一方で、最先端のFSODと比較して新しいタスクのパフォーマンス低下を示す。
本研究は, モデル容量を増大させることなく, 新たな課題に対する競争的結果を達成しつつ, 破滅的な忘れを緩和するための制約に基づく微調整手法(CFA)を提案する。
CFAは、A-GEM(Average Gradient Episodic Memory)という連続学習法をG-FSODに適応させる。
具体的には、新しい勾配更新ルールを導出する勾配探索戦略により多くの制約が課され、ベースクラスと新規クラスの知識交換がより良くなる。
提案手法を評価するため,MS-COCOおよびPASCAL-VOCデータセットについて広範な実験を行った。
提案手法は,基本タスクにマイナーな縮退を伴う新しいタスクにおいて,現在のfsodおよびg-fsodアプローチよりも優れる。
さらに、cfaはfsodアプローチと直交し、モデルのキャパシティや推論時間を増加させることなく、プラグアンドプレイモジュールとして動作する。
関連論文リスト
- High-Performance Few-Shot Segmentation with Foundation Models: An Empirical Study [64.06777376676513]
基礎モデルに基づく数ショットセグメンテーション(FSS)フレームワークを開発した。
具体的には、基礎モデルから暗黙的な知識を抽出し、粗い対応を構築するための簡単なアプローチを提案する。
2つの広く使われているデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-09-10T08:04:11Z) - SMILe: Leveraging Submodular Mutual Information For Robust Few-Shot Object Detection [2.0755366440393743]
Few-Shot Object Detection (FSOD) において、オブジェクトクラスの融合と忘れは重要な課題である。
本稿では,相互情報機能を導入した新しいサブモジュール型相互情報学習フレームワークを提案する。
提案手法は,バックボーンアーキテクチャに依存しないFSODの既存手法に一般化する。
論文 参考訳(メタデータ) (2024-07-02T20:53:43Z) - DiffClass: Diffusion-Based Class Incremental Learning [30.514281721324853]
クラスインクリメンタルラーニング(CIL)は破滅的な忘れが原因で困難である。
最近の例のないCIL手法は、過去のタスクデータを合成することによって破滅的な忘れを軽減しようとする。
そこで本研究では,これらの問題を克服するために,新しい非定型CIL法を提案する。
論文 参考訳(メタデータ) (2024-03-08T03:34:18Z) - Activate and Reject: Towards Safe Domain Generalization under Category
Shift [71.95548187205736]
カテゴリーシフト(DGCS)下における領域一般化の実践的問題について検討する。
未知のクラスサンプルを同時に検出し、ターゲットドメイン内の既知のクラスサンプルを分類することを目的としている。
従来のDGと比較すると,1)ソースクラスのみを用いたトレーニングにおいて,未知の概念を学習する方法,2)ソーストレーニングされたモデルを未知の環境に適応する方法,の2つの新しい課題に直面している。
論文 参考訳(メタデータ) (2023-10-07T07:53:12Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - Fast Hierarchical Learning for Few-Shot Object Detection [57.024072600597464]
転送学習アプローチは、最近、数ショット検出タスクで有望な結果を得た。
これらのアプローチは、ベース検出器の微調整による破滅的な忘れ込みの問題に悩まされる。
この作業における上記の問題に対処する。
論文 参考訳(メタデータ) (2022-10-10T20:31:19Z) - Bridging Non Co-occurrence with Unlabeled In-the-wild Data for
Incremental Object Detection [56.22467011292147]
物体検出における破滅的忘れを緩和するために,いくつかの漸進的学習法が提案されている。
有効性にもかかわらず、これらの手法は新規クラスのトレーニングデータにラベルのないベースクラスの共起を必要とする。
そこで本研究では,新たな授業の訓練において,欠落した基本クラスが原因で生じる非発生を補うために,未ラベルのインザ・ザ・ワイルドデータを使用することを提案する。
論文 参考訳(メタデータ) (2021-10-28T10:57:25Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。