論文の概要: Towards Discriminative and Transferable One-Stage Few-Shot Object
Detectors
- arxiv url: http://arxiv.org/abs/2210.05783v1
- Date: Tue, 11 Oct 2022 20:58:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 12:41:53.370775
- Title: Towards Discriminative and Transferable One-Stage Few-Shot Object
Detectors
- Title(参考訳): 識別・転送可能なワンステップFew-Shotオブジェクト検出器を目指して
- Authors: Karim Guirguis, Mohamed Abdelsamad, George Eskandar, Ahmed Hendawy,
Matthias Kayser, Bin Yang, Juergen Beyerer
- Abstract要約: Few-shot Object Detection (FSOD) は、少数のサンプルを与えられた新しいクラスを学習することでこの問題に対処することを目的としている。
2段と1段のFSODの性能差は, 主に識別性の弱いためである。
これらの制約に対処するため,高密度メタ検出器のための前景サンプル数を増大させるマルチウェイサポートトレーニング戦略であるFew-shot RetinaNet(FSRN)を提案する。
- 参考スコア(独自算出の注目度): 3.9189402702217344
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent object detection models require large amounts of annotated data for
training a new classes of objects. Few-shot object detection (FSOD) aims to
address this problem by learning novel classes given only a few samples. While
competitive results have been achieved using two-stage FSOD detectors,
typically one-stage FSODs underperform compared to them. We make the
observation that the large gap in performance between two-stage and one-stage
FSODs are mainly due to their weak discriminability, which is explained by a
small post-fusion receptive field and a small number of foreground samples in
the loss function. To address these limitations, we propose the Few-shot
RetinaNet (FSRN) that consists of: a multi-way support training strategy to
augment the number of foreground samples for dense meta-detectors, an early
multi-level feature fusion providing a wide receptive field that covers the
whole anchor area and two augmentation techniques on query and source images to
enhance transferability. Extensive experiments show that the proposed approach
addresses the limitations and boosts both discriminability and transferability.
FSRN is almost two times faster than two-stage FSODs while remaining
competitive in accuracy, and it outperforms the state-of-the-art of one-stage
meta-detectors and also some two-stage FSODs on the MS-COCO and PASCAL VOC
benchmarks.
- Abstract(参考訳): 最近のオブジェクト検出モデルは、新しいクラスのオブジェクトをトレーニングするために大量の注釈データを必要とする。
Few-shot Object Detection (FSOD) は、少数のサンプルを与えられた新しいクラスを学習することでこの問題に対処することを目的としている。
2段階のFSOD検出器で競合する結果が得られたが、通常は1段階のFSODはそれに比べて性能が劣る。
本報告では,2段階fsodと1段階fsod間の性能の差が大きいのは,その弱識別性が主であり,損失関数の小さい輸液後受容野と少数の前景試料によって説明される。
これらの制限に対処するために,我々は,密度の高いメタ検出器の前景サンプル数を増加させるマルチウェイサポートトレーニング戦略,アンカーエリア全体をカバーする広い受容領域を提供する初期マルチレベル機能融合,クエリとソースイメージの2つの強化技術,からなる,少数ショットのretinanet (fsrn)を提案する。
広範な実験により、提案手法が限界に対処し、識別性と伝達可能性の両方を増加させることが示されている。
FSRNは2段階のFSODよりもほぼ2倍高速で精度は高く、MS-COCOとPASCAL VOCのベンチマークでは1段階のメタ検出器と2段階のFSODよりも優れている。
関連論文リスト
- Efficient Meta-Learning Enabled Lightweight Multiscale Few-Shot Object Detection in Remote Sensing Images [15.12889076965307]
YOLOv7ワンステージ検出器は、新しいメタラーニングトレーニングフレームワークが組み込まれている。
この変換により、検出器はFSODのタスクに十分対応できると同時に、その固有の軽量化の利点を活かすことができる。
提案検出器の有効性を検証するため, 現状の検出器と性能比較を行った。
論文 参考訳(メタデータ) (2024-04-29T04:56:52Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。