論文の概要: Fine-Grained Prototypes Distillation for Few-Shot Object Detection
- arxiv url: http://arxiv.org/abs/2401.07629v1
- Date: Mon, 15 Jan 2024 12:12:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 17:24:56.658450
- Title: Fine-Grained Prototypes Distillation for Few-Shot Object Detection
- Title(参考訳): ファウショット物体検出のための微粒化原型蒸留法
- Authors: Zichen Wang, Bo Yang, Haonan Yue, Zhenghao Ma
- Abstract要約: Few-shot Object Detection (FSOD) は、新しい物体検出のためのジェネリック検出器を、少数の訓練例で拡張することを目的としている。
一般に、メタラーニングに基づく手法は、新しいサンプルをクラスプロトタイプにエンコードするために追加のサポートブランチを使用する。
より堅牢な新しいオブジェクト検出のために、特徴ある局所的コンテキストをキャプチャするためには、新しい方法が必要である。
- 参考スコア(独自算出の注目度): 8.795211323408513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot object detection (FSOD) aims at extending a generic detector for
novel object detection with only a few training examples. It attracts great
concerns recently due to the practical meanings. Meta-learning has been
demonstrated to be an effective paradigm for this task. In general, methods
based on meta-learning employ an additional support branch to encode novel
examples (a.k.a. support images) into class prototypes, which are then fused
with query branch to facilitate the model prediction. However, the class-level
prototypes are difficult to precisely generate, and they also lack detailed
information, leading to instability in performance.New methods are required to
capture the distinctive local context for more robust novel object detection.
To this end, we propose to distill the most representative support features
into fine-grained prototypes. These prototypes are then assigned into query
feature maps based on the matching results, modeling the detailed feature
relations between two branches. This process is realized by our Fine-Grained
Feature Aggregation (FFA) module. Moreover, in terms of high-level feature
fusion, we propose Balanced Class-Agnostic Sampling (B-CAS) strategy and
Non-Linear Fusion (NLF) module from differenct perspectives. They are
complementary to each other and depict the high-level feature relations more
effectively. Extensive experiments on PASCAL VOC and MS COCO benchmarks show
that our method sets a new state-of-the-art performance in most settings. Our
code is available at https://github.com/wangchen1801/FPD.
- Abstract(参考訳): Few-shot Object Detection (FSOD) は、新しい物体検出のためのジェネリック検出器を拡張することを目的としている。
近年は実践的な意味から大きな関心を集めている。
この課題にはメタラーニングが効果的なパラダイムであることが示されている。
一般に、メタラーニングに基づくメソッドは、新しい例(例えばサポートイメージ)をクラスプロトタイプにエンコードするために追加のサポートブランチを使用し、クエリブランチと融合してモデル予測を容易にする。
しかし, クラスレベルのプロトタイプは正確な生成が困難であり, 詳細な情報も欠如しており, 性能の不安定さを招き, より堅牢な新しいオブジェクト検出のためには, 特徴のある局所的コンテキストを捉える必要がある。
そこで本研究では,最も代表的な支持機能を微細なプロトタイプに蒸留することを提案する。
これらのプロトタイプは、マッチング結果に基づいてクエリ特徴マップに割り当てられ、2つのブランチ間の詳細な特徴関係をモデル化する。
このプロセスは、きめ細かいフィーチャーアグリゲーション(ffa)モジュールによって実現されます。
さらに,高レベル特徴融合の観点からは,b-cas戦略とnlfモジュールの差異を考慮したバランスドクラス非依存サンプリングを提案する。
それらは互いに補完的であり、高レベルな特徴関係をより効果的に描写する。
PASCAL VOC および MS COCO ベンチマークの大規模な実験により,本手法は,ほとんどの設定において新しい最先端性能を実現する。
私たちのコードはhttps://github.com/wangchen1801/fpdで利用可能です。
関連論文リスト
- Open-Vocabulary Object Detection with Meta Prompt Representation and Instance Contrastive Optimization [63.66349334291372]
本稿ではメタプロンプトとインスタンスコントラスト学習(MIC)方式を用いたフレームワークを提案する。
まず、クラスとバックグラウンドのプロンプトを学習するプロンプトが新しいクラスに一般化するのを助けるために、新しいクラスエマージシナリオをシミュレートする。
第二に、クラス内コンパクト性とクラス間分離を促進するためのインスタンスレベルのコントラスト戦略を設計し、新しいクラスオブジェクトに対する検出器の一般化に寄与する。
論文 参考訳(メタデータ) (2024-03-14T14:25:10Z) - Boosting Few-shot 3D Point Cloud Segmentation via Query-Guided
Enhancement [30.017448714419455]
本稿では,PC-FSSモデルの改良手法を提案する。
従来のPC-FSSでは,クエリサンプルの新規クラスを識別するために,サポートプロトタイプのカテゴリ情報を直接活用する手法とは異なり,モデル性能を著しく向上させる2つの重要な側面を同定する。
論文 参考訳(メタデータ) (2023-08-06T18:07:45Z) - Query Adaptive Few-Shot Object Detection with Heterogeneous Graph
Convolutional Networks [33.446875089255876]
Few-shot Object Detection (FSOD) は、いくつかの例を使って見えないオブジェクトを検出することを目的としている。
異種グラフ畳み込みネットワークを用いた新しいFSODモデルを提案する。
論文 参考訳(メタデータ) (2021-12-17T22:08:15Z) - APANet: Adaptive Prototypes Alignment Network for Few-Shot Semantic
Segmentation [56.387647750094466]
Few-shotのセマンティックセマンティックセマンティクスは、指定されたクエリイメージに、ラベル付きサポートイメージのみで、新規クラスのオブジェクトをセグメントすることを目的としている。
ほとんどの高度なソリューションは、各クエリ機能を学習したクラス固有のプロトタイプにマッチさせることでセグメンテーションを実行するメトリクス学習フレームワークを利用している。
本稿では,クラス固有およびクラス非依存のプロトタイプを導入することで,適応型プロトタイプ表現を提案する。
論文 参考訳(メタデータ) (2021-11-24T04:38:37Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Prototype Completion for Few-Shot Learning [13.63424509914303]
少数ショット学習は、いくつかの例で新しいクラスを認識することを目的としている。
事前学習に基づく手法は,特徴抽出器を事前学習し,最寄りのセントロイド型メタラーニングを通して微調整することで,この問題に効果的に対処する。
本稿では,完成度に基づくメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-11T03:44:00Z) - Dynamic Relevance Learning for Few-Shot Object Detection [6.550840743803705]
動的グラフ畳み込みネットワーク(GCN)を構築するために,すべてのサポート画像とクエリ画像上の関心領域(RoI)の関係を利用した動的関連学習モデルを提案する。
提案モデルでは,より一般化された特徴の学習の有効性を示す総合的な性能が得られた。
論文 参考訳(メタデータ) (2021-08-04T18:29:42Z) - MM-FSOD: Meta and metric integrated few-shot object detection [14.631208179789583]
メトリクス学習とメタラーニングを統合した効果的なオブジェクト検出フレームワーク(MM-FSOD)を提案する。
我々のモデルは、トレーニングサンプルにない新しいカテゴリを正確に認識できるクラスに依存しない検出モデルである。
論文 参考訳(メタデータ) (2020-12-30T14:02:52Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。