論文の概要: Few-shot Image Classification with Multi-Facet Prototypes
- arxiv url: http://arxiv.org/abs/2102.00801v1
- Date: Mon, 1 Feb 2021 12:43:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 16:57:36.524100
- Title: Few-shot Image Classification with Multi-Facet Prototypes
- Title(参考訳): マルチファセットプロトタイプを用いたフェーショット画像分類
- Authors: Kun Yan, Zied Bouraoui, Ping Wang, Shoaib Jameel, Steven Schockaert
- Abstract要約: 視覚的特徴をファセットに整理し、同じ種類の特徴を直感的にグループ化する。
カテゴリー名の事前訓練された埋め込みから、顔の重要性を予測することができる。
特に,あるカテゴリの集合に対して,予測されたフェーレット重み付けに依存する適応的類似度尺度を提案する。
- 参考スコア(独自算出の注目度): 48.583388368897126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The aim of few-shot learning (FSL) is to learn how to recognize image
categories from a small number of training examples. A central challenge is
that the available training examples are normally insufficient to determine
which visual features are most characteristic of the considered categories. To
address this challenge, we organize these visual features into facets, which
intuitively group features of the same kind (e.g. features that are relevant to
shape, color, or texture). This is motivated from the assumption that (i) the
importance of each facet differs from category to category and (ii) it is
possible to predict facet importance from a pre-trained embedding of the
category names. In particular, we propose an adaptive similarity measure,
relying on predicted facet importance weights for a given set of categories.
This measure can be used in combination with a wide array of existing
metric-based methods. Experiments on miniImageNet and CUB show that our
approach improves the state-of-the-art in metric-based FSL.
- Abstract(参考訳): 少数ショット学習(FSL)の目的は、少数のトレーニング例から画像カテゴリの認識方法を学ぶことである。
中心となる課題は、利用可能なトレーニングサンプルは通常、考慮されたカテゴリの最も特徴的な視覚特徴を決定するために不十分であることだ。
この課題に対処するため、これらの視覚的特徴をファセットに整理し、同じ種類の機能を直感的にグループ化する(例)。
形状、色、または質感に関連する機能)。
これは, (i) 各ファセットの重要性がカテゴリごとに異なる, (ii) カテゴリ名の事前学習された埋め込みからファセットの重要性を予測することができる,という仮定に基づく。
特に,あるカテゴリの集合に対して,予測されたフェーレット重み付けに依存する適応的類似度尺度を提案する。
この測度は、既存のメトリックベースメソッドの幅広い配列と組み合わせて使用できる。
miniImageNet と CUB の実験により,我々の手法は計量ベース FSL の最先端性の向上を図っている。
関連論文リスト
- Leveraging Multiple Descriptive Features for Robust Few-shot Image
Learning [79.51973736647085]
クラスごとの複数の視覚的特徴の理解に類似した別のアプローチが、頑健な数ショット学習環境で魅力的なパフォーマンスを提供できることを示す。
特に、大きな言語モデル(LLM)を介して、各クラスの複数の視覚的記述を自動的に列挙し、視覚イメージモデルを使用して、これらの記述を各画像の複数の視覚的特徴のセットに変換する。
これはどちらも、各クラスに関連する一連の直感的な機能を提供し、数ショットの学習設定では、線形プローブのような標準的なアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-07-10T03:06:45Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - Semantic Cross Attention for Few-shot Learning [9.529264466445236]
本稿では,ラベルテキストのセマンティックな特徴を補助的タスクとして見るためのマルチタスク学習手法を提案する。
提案モデルでは,単語埋め込み表現をセマンティックな特徴として用いて,埋め込みネットワークとセマンティックなクロスアテンションモジュールをトレーニングし,セマンティックな特徴を一般的な視覚的モーダルにブリッジする。
論文 参考訳(メタデータ) (2022-10-12T15:24:59Z) - Not All Instances Contribute Equally: Instance-adaptive Class
Representation Learning for Few-Shot Visual Recognition [94.04041301504567]
少数ショットの視覚認識は、いくつかのラベル付きインスタンスから新しい視覚概念を認識することを指す。
本稿では,数ショットの視覚認識を実現するために,インスタンス適応型クラス表現学習ネットワーク(ICRL-Net)と呼ばれる新しいメトリックベースのメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-07T10:00:18Z) - Learning Primitive-aware Discriminative Representations for Few-shot
Learning [28.17404445820028]
少ないショットラーニングは、いくつかのラベル付き例で、新しいクラスを容易に認識できる分類器を学習することを目的としている。
プリミティブ・マイニング・アンド・リ共振ネットワーク(PMRN)を提案し,プリミティブ・アウェアな表現を学習する。
提案手法は,6つの標準ベンチマークの最先端結果を実現する。
論文 参考訳(メタデータ) (2022-08-20T16:22:22Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - CAD: Co-Adapting Discriminative Features for Improved Few-Shot
Classification [11.894289991529496]
少数のラベル付きサンプルを与えられた未確認のクラスに適応できるモデルを学ぶことを目的としている。
最近のアプローチでは、特徴抽出器を事前訓練し、その後、エピソードなメタラーニングのための微調整を行う。
本研究は, 複数ショットの分類において, 横断的および再重み付き識別機能を実現するための戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T06:14:51Z) - Discovering Relationships between Object Categories via Universal
Canonical Maps [80.07703460198198]
変形可能なオブジェクトの複数カテゴリの幾何学を共同で学習する問題に取り組む。
近年の研究では、関連オブジェクトのいくつかのカテゴリに対して、統合された高密度ポーズ予測器を学習できることが示されている。
改良された対応性は,カテゴリ固有の高密度ポーズ予測器の自然な副産物として自動的に学習できることを示す。
論文 参考訳(メタデータ) (2021-06-17T18:38:18Z) - Progressive Co-Attention Network for Fine-grained Visual Classification [20.838908090777885]
きめ細かい視覚分類は、同じカテゴリ内の複数のサブカテゴリに属する画像を認識することを目的としている。
既存のほとんどの方法は個々の画像のみを入力とする。
そこで本研究では,pca-net(progressive co-attention network)と呼ばれる効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T10:19:02Z) - Match Them Up: Visually Explainable Few-shot Image Classification [27.867833878756553]
ほとんどショットラーニングは、通常、訓練済みの知識がベース(見えない)カテゴリから得られ、新しい(見えない)カテゴリに十分に移行できるという仮定に基づいている。
本稿では、バックボーンモデルからの視覚的表現と、新たに導入された説明可能な分類器によって生成される重みを用いて、画像分類のための新しいFSLを実行する方法を明らかにする。
実験結果から,提案手法は3つの主流データセットに対して良好な精度と良好な説明性が得られることが示された。
論文 参考訳(メタデータ) (2020-11-25T05:47:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。