論文の概要: Meta-DETR: Few-Shot Object Detection via Unified Image-Level
Meta-Learning
- arxiv url: http://arxiv.org/abs/2103.11731v2
- Date: Thu, 25 Mar 2021 04:54:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-26 12:43:53.518700
- Title: Meta-DETR: Few-Shot Object Detection via Unified Image-Level
Meta-Learning
- Title(参考訳): Meta-DETR:Unified Image-Level Meta-LearningによるFew-Shotオブジェクト検出
- Authors: Gongjie Zhang, Zhipeng Luo, Kaiwen Cui, Shijian Lu
- Abstract要約: 少数の注釈付き例だけで、新規な物体の検出を狙っている。
本稿では,新しいメタ検出器フレームワークであるMeta-DETRを提案する。
代わりに、オブジェクトローカリゼーションと画像レベルでの分類を統一的で補完的な方法でメタ学習します。
- 参考スコア(独自算出の注目度): 39.50529982746885
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Few-shot object detection aims at detecting novel objects with only a few
annotated examples. Prior works have proved meta-learning a promising solution,
and most of them essentially address detection by meta-learning over regions
for their classification and location fine-tuning. However, these methods
substantially rely on initially well-located region proposals, which are
usually hard to obtain under the few-shot settings. This paper presents a novel
meta-detector framework, namely Meta-DETR, which eliminates region-wise
prediction and instead meta-learns object localization and classification at
image level in a unified and complementary manner. Specifically, it first
encodes both support and query images into category-specific features and then
feeds them into a category-agnostic decoder to directly generate predictions
for specific categories. To facilitate meta-learning with deep networks, we
design a simple but effective Semantic Alignment Mechanism (SAM), which aligns
high-level and low-level feature semantics to improve the generalization of
meta-learned representations. Experiments over multiple few-shot object
detection benchmarks show that Meta-DETR outperforms state-of-the-art methods
by large margins.
- Abstract(参考訳): 少数の注釈付き例でのみ、新規な物体を検出することを目的としている。
従来の研究は、メタラーニングが有望な解決策であることを証明しており、そのほとんどは、分類と位置の微調整のために、地域にわたってメタラーニングによる検出に対処している。
しかし、これらの手法は、初期よく配置された地域の提案に実質的に依存しており、これは通常、少数の設定では入手が困難である。
本稿では,領域的予測を排除し,画像レベルでのメタ学習オブジェクトの局所化と分類を統一的かつ補完的に行うメタ検出フレームワークMeta-DETRを提案する。
具体的には、まずサポートとクエリの両方をカテゴリ固有の機能にエンコードし、次にカテゴリに依存しないデコーダに入力して、特定のカテゴリの予測を直接生成する。
ディープネットワークを用いたメタ学習を容易にするために,高レベルかつ低レベルの特徴意味論を整合させ,メタ学習表現の一般化を改善する,単純かつ効果的な意味的アライメント機構(sam)を設計した。
複数の数ショットのオブジェクト検出ベンチマーク実験により、Meta-DETRは最先端の手法よりも大きなマージンで優れていることが示された。
関連論文リスト
- Learning to Adapt Category Consistent Meta-Feature of CLIP for Few-Shot Classification [1.6385815610837167]
最近のCLIPに基づく手法では、画像分類タスクにおいてゼロショットと少数ショットのパフォーマンスが期待できる。
LRと高レベルセマンティック表現の相補的な長所を組み合わせたメタ機能適応法(MF-Adapter)を提案する。
提案手法は,最先端のCLIP下流数ショット分類法よりも優れており,難易度の高い視覚的分類課題に対して高い性能を示す。
論文 参考訳(メタデータ) (2024-07-08T06:18:04Z) - Meta-ZSDETR: Zero-shot DETR with Meta-learning [29.58827207505671]
本稿では,DeTRとメタラーニングを組み合わせてゼロショットオブジェクト検出を行うMeta-ZSDETRを提案する。
このモデルは、回帰ヘッドを含むメタコントラスト学習で最適化され、クラス固有のボックスの座標を生成する。
実験の結果,本手法は既存のZSD法よりも高い性能を示した。
論文 参考訳(メタデータ) (2023-08-18T13:17:07Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - Meta-DETR: Image-Level Few-Shot Detection with Inter-Class Correlation
Exploitation [100.87407396364137]
画像レベルの最小ショット検出装置であるMeta-DETRを設計し、(i)クラス間相関メタ学習戦略を新たに導入する。
複数の数ショットのオブジェクト検出ベンチマーク実験により、提案したMeta-DETRは最先端の手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-07-30T13:46:07Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with
Attentive Feature Alignment [33.446875089255876]
Few-shot Object Detection (FSOD) は、少数の例でオブジェクトを検出することを目的としている。
本稿では,データ不足ベースクラスから学習したメタ知識を新しいクラスに転送することで,メタラーニングに基づくマイショットオブジェクト検出手法を提案する。
論文 参考訳(メタデータ) (2021-04-15T19:01:27Z) - CAFENet: Class-Agnostic Few-Shot Edge Detection Network [19.01453512012934]
我々は、数発のセマンティックエッジ検出と呼ばれる、新しい数発の学習課題に取り組む。
また,メタ学習戦略に基づくクラス非依存Few-shot Edge Detection Network (CAFENet)を提案する。
論文 参考訳(メタデータ) (2020-03-18T14:18:59Z) - Meta-Baseline: Exploring Simple Meta-Learning for Few-Shot Learning [79.25478727351604]
評価基準に基づいて,分類済みモデル全体に対するメタラーニング(メタラーニング)を提案する。
我々は,この単純な手法が標準ベンチマークにおける最先端手法との競合性能を達成するのを観察する。
論文 参考訳(メタデータ) (2020-03-09T20:06:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。