論文の概要: An Effective Crop-Paste Pipeline for Few-shot Object Detection
- arxiv url: http://arxiv.org/abs/2302.14452v1
- Date: Tue, 28 Feb 2023 09:56:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 17:00:03.542482
- Title: An Effective Crop-Paste Pipeline for Few-shot Object Detection
- Title(参考訳): 少ない被写体検出に有効なクロップペーストパイプライン
- Authors: Shaobo Lin, Kun Wang, Xingyu Zeng, Rui Zhao
- Abstract要約: Few-shot Object Detection (FSOD) は、トレーニングのいくつかの例に限って、新しいカテゴリのオブジェクト検出器を拡張することを目的としている。
我々は,新規インスタンスをクローンし,選択したベースイメージにペーストする新しいデータ拡張パイプラインを提案する。
提案手法は単純で有効であり,既存のFSOD法に簡単に接続でき,使用可能性を示す。
- 参考スコア(独自算出の注目度): 27.26215175101865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot object detection (FSOD) aims to expand an object detector for novel
categories given only a few instances for training. However, detecting novel
categories with only a few samples usually leads to the problem of
misclassification. In FSOD, we notice the false positive (FP) of novel
categories is prominent, in which the base categories are often recognized as
novel ones. To address this issue, a novel data augmentation pipeline that
Crops the Novel instances and Pastes them on the selected Base images, called
CNPB, is proposed. There are two key questions to be answered: (1) How to
select useful base images? and (2) How to combine novel and base data? We
design a multi-step selection strategy to find useful base data. Specifically,
we first discover the base images which contain the FP of novel categories and
select a certain amount of samples from them for the base and novel categories
balance. Then the bad cases, such as the base images that have unlabeled ground
truth or easily confused base instances, are removed by using CLIP. Finally,
the same category strategy is adopted, in which a novel instance with category
n is pasted on the base image with the FP of n. During combination, a novel
instance is cropped and randomly down-sized, and thus pasted at the assigned
optimal location from the randomly generated candidates in a selected base
image. Our method is simple yet effective and can be easy to plug into existing
FSOD methods, demonstrating significant potential for use. Extensive
experiments on PASCAL VOC and MS COCO validate the effectiveness of our method.
- Abstract(参考訳): Few-shot Object Detection (FSOD) は、トレーニングのいくつかの例に限って、新しいカテゴリのオブジェクト検出器を拡張することを目的としている。
しかし、少数のサンプルしか持たない新しいカテゴリの検出は、通常、誤分類の問題につながる。
FSODでは,新規カテゴリーの偽陽性(FP)が顕著であり,基本カテゴリーは新規カテゴリーと認識されることが多い。
この問題に対処するために, cnpbと呼ばれる, 新規インスタンスを抽出し, 選択したベースイメージにペーストする新しいデータ拡張パイプラインを提案する。
1) 有用なベースイメージをどのように選択するか?
そして(2)新しいデータとベースデータを組み合わせるには?
有用なベースデータを見つけるために,多段階選択戦略を設計する。
具体的には、まず、新しいカテゴリのFPを含むベースイメージを発見し、そのベースと新しいカテゴリのバランスのために、一定の量のサンプルを選択する。
そして、CLIPを使用して、未ラベルの基底画像や容易に混乱したベースインスタンスなどの悪いケースを除去する。
最後に、n の FP の基底画像上に、n の新規なインスタンスをペーストする同じカテゴリ戦略が採用されている。
組み合わせの間、新規インスタンスをトリミングしてランダムにダウンサイズし、選択されたベース画像内のランダムに生成された候補から割り当てられた最適な位置にペーストする。
本手法は単純かつ効果的であり,既存のfsodメソッドへの接続が容易であり,有用性が示唆される。
PASCAL VOCおよびMS COCOの大規模実験により,本法の有効性が検証された。
関連論文リスト
- Few-Shot Anomaly Detection via Category-Agnostic Registration Learning [65.64252994254268]
既存のほとんどの異常検出方法は、各カテゴリに専用のモデルを必要とする。
この記事では、新しい数ショットAD(FSAD)フレームワークを提案する。
これは新しいカテゴリーのモデル微調整を必要としない最初のFSAD法である。
論文 参考訳(メタデータ) (2024-06-13T05:01:13Z) - Learnable Prompt for Few-Shot Semantic Segmentation in Remote Sensing Domain [0.0]
Few-shotセグメンテーション(Few-shot segmentation)は、いくつかのアノテーション付きの例だけを与えられた画像内でオブジェクトや新しいクラスの領域を分割するタスクである。
私たちはベースモデルとしてSegGPTを使用し、ベースクラスでそれをトレーニングします。
通常リモートセンシング領域に存在する様々なオブジェクトサイズを扱うために、パッチベースの予測を行う。
論文 参考訳(メタデータ) (2024-04-16T06:33:08Z) - NIFF: Alleviating Forgetting in Generalized Few-Shot Object Detection
via Neural Instance Feature Forging [4.115458354238768]
Generalized Few-shot Object Detection (G-FSOD)はAIの学習パラダイムである。
G-FSODは、基礎クラスの破滅的な忘れを緩和しながら、新しいクラスを学ぶことを目指している。
本稿では,G-FSODのためのデータフリーな知識蒸留(DFKD)手法を提案する。
論文 参考訳(メタデータ) (2023-03-09T00:26:59Z) - Prediction Calibration for Generalized Few-shot Semantic Segmentation [101.69940565204816]
汎用Few-shot Semantic (GFSS) は、各画像ピクセルを、豊富なトレーニング例を持つベースクラスか、クラスごとにわずかに(例: 1-5)のトレーニングイメージを持つ新しいクラスのいずれかに分割することを目的としている。
我々は、融合したマルチレベル機能を用いて、分類器の最終予測をガイドするクロスアテンションモジュールを構築する。
私たちのPCNは、最先端の代替品よりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2022-10-15T13:30:12Z) - Bridging Non Co-occurrence with Unlabeled In-the-wild Data for
Incremental Object Detection [56.22467011292147]
物体検出における破滅的忘れを緩和するために,いくつかの漸進的学習法が提案されている。
有効性にもかかわらず、これらの手法は新規クラスのトレーニングデータにラベルのないベースクラスの共起を必要とする。
そこで本研究では,新たな授業の訓練において,欠落した基本クラスが原因で生じる非発生を補うために,未ラベルのインザ・ザ・ワイルドデータを使用することを提案する。
論文 参考訳(メタデータ) (2021-10-28T10:57:25Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Revisiting Deep Local Descriptor for Improved Few-Shot Classification [56.74552164206737]
textbfDense textbfClassification と textbfAttentive textbfPooling を利用して埋め込みの質を向上させる方法を示す。
広範に使われているグローバル平均プール (GAP) の代わりに, 注意深いプールを施し, 特徴マップをプールすることを提案する。
論文 参考訳(メタデータ) (2021-03-30T00:48:28Z) - Few-shot Weakly-Supervised Object Detection via Directional Statistics [55.97230224399744]
少数ショットコモンオブジェクトローカライゼーション(COL)と少数ショット弱監視オブジェクト検出(WSOD)のための確率論的多重インスタンス学習手法を提案する。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
提案手法は, 単純であるにもかかわらず, 少数のCOLとWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
論文 参考訳(メタデータ) (2021-03-25T22:34:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。