論文の概要: Few-shot Image Classification with Multi-Facet Prototypes
- arxiv url: http://arxiv.org/abs/2102.00801v1
- Date: Mon, 1 Feb 2021 12:43:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 16:57:36.524100
- Title: Few-shot Image Classification with Multi-Facet Prototypes
- Title(参考訳): マルチファセットプロトタイプを用いたフェーショット画像分類
- Authors: Kun Yan, Zied Bouraoui, Ping Wang, Shoaib Jameel, Steven Schockaert
- Abstract要約: 視覚的特徴をファセットに整理し、同じ種類の特徴を直感的にグループ化する。
カテゴリー名の事前訓練された埋め込みから、顔の重要性を予測することができる。
特に,あるカテゴリの集合に対して,予測されたフェーレット重み付けに依存する適応的類似度尺度を提案する。
- 参考スコア(独自算出の注目度): 48.583388368897126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The aim of few-shot learning (FSL) is to learn how to recognize image
categories from a small number of training examples. A central challenge is
that the available training examples are normally insufficient to determine
which visual features are most characteristic of the considered categories. To
address this challenge, we organize these visual features into facets, which
intuitively group features of the same kind (e.g. features that are relevant to
shape, color, or texture). This is motivated from the assumption that (i) the
importance of each facet differs from category to category and (ii) it is
possible to predict facet importance from a pre-trained embedding of the
category names. In particular, we propose an adaptive similarity measure,
relying on predicted facet importance weights for a given set of categories.
This measure can be used in combination with a wide array of existing
metric-based methods. Experiments on miniImageNet and CUB show that our
approach improves the state-of-the-art in metric-based FSL.
- Abstract(参考訳): 少数ショット学習(FSL)の目的は、少数のトレーニング例から画像カテゴリの認識方法を学ぶことである。
中心となる課題は、利用可能なトレーニングサンプルは通常、考慮されたカテゴリの最も特徴的な視覚特徴を決定するために不十分であることだ。
この課題に対処するため、これらの視覚的特徴をファセットに整理し、同じ種類の機能を直感的にグループ化する(例)。
形状、色、または質感に関連する機能)。
これは, (i) 各ファセットの重要性がカテゴリごとに異なる, (ii) カテゴリ名の事前学習された埋め込みからファセットの重要性を予測することができる,という仮定に基づく。
特に,あるカテゴリの集合に対して,予測されたフェーレット重み付けに依存する適応的類似度尺度を提案する。
この測度は、既存のメトリックベースメソッドの幅広い配列と組み合わせて使用できる。
miniImageNet と CUB の実験により,我々の手法は計量ベース FSL の最先端性の向上を図っている。
関連論文リスト
- Preview-based Category Contrastive Learning for Knowledge Distillation [53.551002781828146]
知識蒸留(PCKD)のための新しい予見型カテゴリーコントラスト学習法を提案する。
まず、インスタンスレベルの特徴対応と、インスタンスの特徴とカテゴリ中心の関係の両方の構造的知識を蒸留する。
カテゴリ表現を明示的に最適化し、インスタンスとカテゴリの表現を明確に関連付けることができる。
論文 参考訳(メタデータ) (2024-10-18T03:31:00Z) - Category-Prompt Refined Feature Learning for Long-Tailed Multi-Label Image Classification [8.139529179222844]
Category-Prompt Refined Feature Learning (CPRFL) は長尺多ラベル画像分類の新しい手法である。
CPRFLは、事前訓練されたCLIPの埋め込みからカテゴリプロンプトを初期化し、カテゴリ固有の視覚表現を分離する。
2つのLCMLCベンチマークにおいて,本手法の有効性を検証し,本手法がベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-15T12:51:57Z) - Learning to Adapt Category Consistent Meta-Feature of CLIP for Few-Shot Classification [1.6385815610837167]
最近のCLIPに基づく手法では、画像分類タスクにおいてゼロショットと少数ショットのパフォーマンスが期待できる。
LRと高レベルセマンティック表現の相補的な長所を組み合わせたメタ機能適応法(MF-Adapter)を提案する。
提案手法は,最先端のCLIP下流数ショット分類法よりも優れており,難易度の高い視覚的分類課題に対して高い性能を示す。
論文 参考訳(メタデータ) (2024-07-08T06:18:04Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - Semantic Cross Attention for Few-shot Learning [9.529264466445236]
本稿では,ラベルテキストのセマンティックな特徴を補助的タスクとして見るためのマルチタスク学習手法を提案する。
提案モデルでは,単語埋め込み表現をセマンティックな特徴として用いて,埋め込みネットワークとセマンティックなクロスアテンションモジュールをトレーニングし,セマンティックな特徴を一般的な視覚的モーダルにブリッジする。
論文 参考訳(メタデータ) (2022-10-12T15:24:59Z) - Not All Instances Contribute Equally: Instance-adaptive Class
Representation Learning for Few-Shot Visual Recognition [94.04041301504567]
少数ショットの視覚認識は、いくつかのラベル付きインスタンスから新しい視覚概念を認識することを指す。
本稿では,数ショットの視覚認識を実現するために,インスタンス適応型クラス表現学習ネットワーク(ICRL-Net)と呼ばれる新しいメトリックベースのメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-07T10:00:18Z) - Learning Primitive-aware Discriminative Representations for Few-shot
Learning [28.17404445820028]
少ないショットラーニングは、いくつかのラベル付き例で、新しいクラスを容易に認識できる分類器を学習することを目的としている。
プリミティブ・マイニング・アンド・リ共振ネットワーク(PMRN)を提案し,プリミティブ・アウェアな表現を学習する。
提案手法は,6つの標準ベンチマークの最先端結果を実現する。
論文 参考訳(メタデータ) (2022-08-20T16:22:22Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - Discovering Relationships between Object Categories via Universal
Canonical Maps [80.07703460198198]
変形可能なオブジェクトの複数カテゴリの幾何学を共同で学習する問題に取り組む。
近年の研究では、関連オブジェクトのいくつかのカテゴリに対して、統合された高密度ポーズ予測器を学習できることが示されている。
改良された対応性は,カテゴリ固有の高密度ポーズ予測器の自然な副産物として自動的に学習できることを示す。
論文 参考訳(メタデータ) (2021-06-17T18:38:18Z) - Progressive Co-Attention Network for Fine-grained Visual Classification [20.838908090777885]
きめ細かい視覚分類は、同じカテゴリ内の複数のサブカテゴリに属する画像を認識することを目的としている。
既存のほとんどの方法は個々の画像のみを入力とする。
そこで本研究では,pca-net(progressive co-attention network)と呼ばれる効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T10:19:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。