論文の概要: Prototypical Region Proposal Networks for Few-Shot Localization and
Classification
- arxiv url: http://arxiv.org/abs/2104.03496v1
- Date: Thu, 8 Apr 2021 04:03:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 13:14:14.844816
- Title: Prototypical Region Proposal Networks for Few-Shot Localization and
Classification
- Title(参考訳): Few-Shotローカライゼーションと分類のためのプロトタイプ領域提案ネットワーク
- Authors: Elliott Skomski, Aaron Tuor, Andrew Avila, Lauren Phillips, Zachary
New, Henry Kvinge, Courtney D. Corley, and Nathan Hodas
- Abstract要約: 分割と分類をエンドツーエンドの分類モデルであるPRoPnetに統一するフレームワークを開発する。
本手法は,複数のオブジェクトクラスを含む自然シーンを用いた画像データセットの精度向上を実証した。
- 参考スコア(独自算出の注目度): 1.5100087942838936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently proposed few-shot image classification methods have generally
focused on use cases where the objects to be classified are the central subject
of images. Despite success on benchmark vision datasets aligned with this use
case, these methods typically fail on use cases involving densely-annotated,
busy images: images common in the wild where objects of relevance are not the
central subject, instead appearing potentially occluded, small, or among other
incidental objects belonging to other classes of potential interest. To
localize relevant objects, we employ a prototype-based few-shot segmentation
model which compares the encoded features of unlabeled query images with
support class centroids to produce region proposals indicating the presence and
location of support set classes in a query image. These region proposals are
then used as additional conditioning input to few-shot image classifiers. We
develop a framework to unify the two stages (segmentation and classification)
into an end-to-end classification model -- PRoPnet -- and empirically
demonstrate that our methods improve accuracy on image datasets with natural
scenes containing multiple object classes.
- Abstract(参考訳): 近年,画像の分類法として,分類対象が画像の中心的な主題であるユースケースに焦点が当てられている。
このユースケースに合わせたベンチマークビジョンデータセットの成功にもかかわらず、これらの方法は一般的に、密に注釈された、多忙な画像を含むユースケースで失敗する。
関連するオブジェクトのローカライズには,ラベルなしの問合せ画像の符号化特徴をクラスセンタロイドで比較し,問合せ画像における支持集合クラスの存在と位置を示す領域提案を生成する,プロトタイプベースの少数ショットセグメンテーションモデルを用いる。
これらの領域の提案は、少数ショットの画像分類器への追加条件入力として使用される。
我々は,2つの段階(セグメンテーションと分類)をエンドツーエンドの分類モデルであるPRoPnetに統一するフレームワークを開発し,複数のオブジェクトクラスを含む自然なシーンによる画像データセットの精度向上を実証的に実証した。
関連論文リスト
- Exploiting Unlabeled Data with Vision and Language Models for Object
Detection [64.94365501586118]
堅牢で汎用的なオブジェクト検出フレームワークを構築するには、より大きなラベルスペースとより大きなトレーニングデータセットへのスケーリングが必要である。
本稿では,近年の視覚と言語モデルで利用可能なリッチなセマンティクスを利用して,未ラベル画像中のオブジェクトのローカライズと分類を行う手法を提案する。
生成した擬似ラベルの価値を,オープン語彙検出と半教師付きオブジェクト検出の2つのタスクで示す。
論文 参考訳(メタデータ) (2022-07-18T21:47:15Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - Improving Few-shot Learning with Weakly-supervised Object Localization [24.3569501375842]
画像のクラス関連領域から特徴を抽出してクラス表現を生成する新しいフレームワークを提案する。
提案手法は, miniImageNet および tieredImageNet ベンチマークにおいて,ベースライン数ショットモデルよりも優れている。
論文 参考訳(メタデータ) (2021-05-25T07:39:32Z) - Sketch-Guided Object Localization in Natural Images [16.982683600384277]
スケッチクエリにより,物体のすべてのインスタンスを自然な画像にローカライズする新たな問題(トレーニング中は見えなかったり見えなかったり)を導入する。
本稿では,スケッチクエリに関連するオブジェクト提案を生成するために,地域提案ネットワーク(RPN)をガイドする新しいクロスモーダルアテンションスキームを提案する。
我々の手法は1つのスケッチクエリで有効である。
論文 参考訳(メタデータ) (2020-08-14T19:35:56Z) - Weakly-Supervised Semantic Segmentation via Sub-category Exploration [73.03956876752868]
我々は、オブジェクトの他の部分に注意を払うために、ネットワークを強制する単純で効果的なアプローチを提案する。
具体的には、画像の特徴をクラスタリングして、アノテーション付き親クラスごとに擬似サブカテゴリラベルを生成する。
提案手法の有効性を検証し,提案手法が最先端手法に対して良好に機能することを示す。
論文 参考訳(メタデータ) (2020-08-03T20:48:31Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。
提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。
本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文 参考訳(メタデータ) (2020-07-03T18:23:39Z) - Weakly-supervised Object Localization for Few-shot Learning and
Fine-grained Few-shot Learning [0.5156484100374058]
少数のサンプルから新しい視覚カテゴリーを学習することを目的としている。
本稿では,自己認識型補完モジュール(SACモジュール)を提案する。
また,数発の分類のために,識別的深層記述子を選択するためのアクティブマスクも生成する。
論文 参考訳(メタデータ) (2020-03-02T14:07:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。