論文の概要: A Unified Framework for Attention-Based Few-Shot Object Detection
- arxiv url: http://arxiv.org/abs/2201.02052v1
- Date: Thu, 6 Jan 2022 13:35:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-07 18:09:04.040474
- Title: A Unified Framework for Attention-Based Few-Shot Object Detection
- Title(参考訳): 注意に基づく少数ショット物体検出のための統一フレームワーク
- Authors: Pierre Le Jeune and Anissa Mokraoui
- Abstract要約: Few-Shot Object Detection (FSOD) はコンピュータビジョンにおいて急速に成長している分野である。
与えられたクラスの集合のすべての発生を、各クラスに対していくつかの注釈付きの例で見つけることで構成される。
- 参考スコア(独自算出の注目度): 3.4874998970351427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-Shot Object Detection (FSOD) is a rapidly growing field in computer
vision. It consists in finding all occurrences of a given set of classes with
only a few annotated examples for each class. Numerous methods have been
proposed to address this challenge and most of them are based on attention
mechanisms. However, the great variety of classic object detection frameworks
and training strategies makes performance comparison between methods difficult.
In particular, for attention-based FSOD methods, it is laborious to compare the
impact of the different attention mechanisms on performance. This paper aims at
filling this shortcoming. To do so, a flexible framework is proposed to allow
the implementation of most of the attention techniques available in the
literature. To properly introduce such a framework, a detailed review of the
existing FSOD methods is firstly provided. Some different attention mechanisms
are then reimplemented within the framework and compared with all other
parameters fixed.
- Abstract(参考訳): Few-Shot Object Detection (FSOD) はコンピュータビジョンにおいて急速に成長している分野である。
与えられたクラスのすべての発生を、各クラスのアノテーション付きの例で見つけることで構成される。
この課題に対処するために多くの手法が提案されており、そのほとんどは注意機構に基づいている。
しかしながら、さまざまな古典的なオブジェクト検出フレームワークとトレーニング戦略は、メソッド間のパフォーマンス比較を困難にしている。
特に注意に基づくfsod法では,注意機構の違いが性能に与える影響を比較するのに手間がかかる。
本論文は,この欠点を満たすことを目的とする。
そのため,文献で利用可能な注意技法のほとんどを実装可能な柔軟なフレームワークが提案されている。
このようなフレームワークを適切に導入するために、まず既存のFSODメソッドの詳細なレビューを行う。
いくつかの異なる注意機構がフレームワーク内で再実装され、他のすべてのパラメータと比較される。
関連論文リスト
- Beyond Few-shot Object Detection: A Detailed Survey [25.465534270637523]
研究者たちは、数発の学習とオブジェクト検出の原則を融合させる、数発のオブジェクト検出(FSOD)アプローチを導入した。
これらのアプローチは、広範なラベル付きデータセットへの依存を減らす上で重要な役割を果たす。
本研究の目的は,上記の数ショット設定を包括的に理解し,各FSODタスクの方法論を探索することである。
論文 参考訳(メタデータ) (2024-08-26T13:09:23Z) - Beyond Mask: Rethinking Guidance Types in Few-shot Segmentation [67.35274834837064]
我々は、テキスト、マスク、ボックス、画像からのプロンプトを統合するユニバーサルビジョン言語フレームワーク(UniFSS)を開発した。
UniFSSは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2024-07-16T08:41:01Z) - Towards Robust Semantic Segmentation against Patch-based Attack via Attention Refinement [68.31147013783387]
我々は,アテンション機構がパッチベースの敵攻撃に弱いことを観察した。
本稿では,意味的セグメンテーションモデルの堅牢性を改善するために,ロバスト注意機構(RAM)を提案する。
論文 参考訳(メタデータ) (2024-01-03T13:58:35Z) - Dual Prototype Attention for Unsupervised Video Object Segmentation [28.725754274542304]
教師なしビデオオブジェクトセグメンテーション(VOS)は、ビデオ中の最も有能なオブジェクトを検出し、セグメンテーションすることを目的としている。
本稿では,2つの新しいプロトタイプベースアテンション機構,IMA(Inter-modality attention)とフレーム間アテンション(IFA)を提案する。
論文 参考訳(メタデータ) (2022-11-22T06:19:17Z) - A Comparative Attention Framework for Better Few-Shot Object Detection
on Aerial Images [2.292003207440126]
Few-Shot Object Detection (FSOD) 法は主に自然画像データセットに基づいて設計・評価されている。
自然画像の最良の方法が空中画像の最良の方法であるかどうかは不明だ。
本稿では,アテンションベースのFSOD手法の実装と比較を行うフレキシブルな環境を提供するベンチマークフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-25T11:20:31Z) - Label-Driven Denoising Framework for Multi-Label Few-Shot Aspect
Category Detection [27.319209062256448]
本稿では,上記の問題に対処する新しいラベル駆動型Denoising Framework(LDF)を提案する。
我々のフレームワークは、他の最先端の手法よりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-09T10:37:43Z) - Meta-DETR: Image-Level Few-Shot Detection with Inter-Class Correlation
Exploitation [100.87407396364137]
画像レベルの最小ショット検出装置であるMeta-DETRを設計し、(i)クラス間相関メタ学習戦略を新たに導入する。
複数の数ショットのオブジェクト検出ベンチマーク実験により、提案したMeta-DETRは最先端の手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-07-30T13:46:07Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - BriNet: Towards Bridging the Intra-class and Inter-class Gaps in
One-Shot Segmentation [84.2925550033094]
ほとんどショットのセグメンテーションは、限られたトレーニングサンプルで見えないオブジェクトインスタンスをセグメンテーションするためのモデルの一般化に焦点を当てている。
本稿では,クエリの抽出した特徴とサポートイメージのギャップを埋めるフレームワーク BriNet を提案する。
本フレームワークの有効性は,他の競合手法よりも優れる実験結果によって実証された。
論文 参考訳(メタデータ) (2020-08-14T07:45:50Z) - A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。
提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。
本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文 参考訳(メタデータ) (2020-07-03T18:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。