Fugu-MT 論文翻訳(概要): Few-shot Image Classification with Multi-Facet Prototypes

論文の概要: Few-shot Image Classification with Multi-Facet Prototypes

arxiv url: http://arxiv.org/abs/2102.00801v1
Date: Mon, 1 Feb 2021 12:43:03 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-02 16:57:36.524100
Title: Few-shot Image Classification with Multi-Facet Prototypes
Title（参考訳）: マルチファセットプロトタイプを用いたフェーショット画像分類
Authors: Kun Yan, Zied Bouraoui, Ping Wang, Shoaib Jameel, Steven Schockaert
Abstract要約: 視覚的特徴をファセットに整理し、同じ種類の特徴を直感的にグループ化する。カテゴリー名の事前訓練された埋め込みから、顔の重要性を予測することができる。特に,あるカテゴリの集合に対して,予測されたフェーレット重み付けに依存する適応的類似度尺度を提案する。
参考スコア（独自算出の注目度）: 48.583388368897126
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The aim of few-shot learning (FSL) is to learn how to recognize image categories from a small number of training examples. A central challenge is that the available training examples are normally insufficient to determine which visual features are most characteristic of the considered categories. To address this challenge, we organize these visual features into facets, which intuitively group features of the same kind (e.g. features that are relevant to shape, color, or texture). This is motivated from the assumption that (i) the importance of each facet differs from category to category and (ii) it is possible to predict facet importance from a pre-trained embedding of the category names. In particular, we propose an adaptive similarity measure, relying on predicted facet importance weights for a given set of categories. This measure can be used in combination with a wide array of existing metric-based methods. Experiments on miniImageNet and CUB show that our approach improves the state-of-the-art in metric-based FSL.
Abstract（参考訳）: 少数ショット学習(FSL)の目的は、少数のトレーニング例から画像カテゴリの認識方法を学ぶことである。中心となる課題は、利用可能なトレーニングサンプルは通常、考慮されたカテゴリの最も特徴的な視覚特徴を決定するために不十分であることだ。この課題に対処するため、これらの視覚的特徴をファセットに整理し、同じ種類の機能を直感的にグループ化する(例)。形状、色、または質感に関連する機能)。これは, (i) 各ファセットの重要性がカテゴリごとに異なる, (ii) カテゴリ名の事前学習された埋め込みからファセットの重要性を予測することができる,という仮定に基づく。特に,あるカテゴリの集合に対して,予測されたフェーレット重み付けに依存する適応的類似度尺度を提案する。この測度は、既存のメトリックベースメソッドの幅広い配列と組み合わせて使用できる。 miniImageNet と CUB の実験により,我々の手法は計量ベース FSL の最先端性の向上を図っている。

関連論文リスト

Preview-based Category Contrastive Learning for Knowledge Distillation [53.551002781828146]
知識蒸留(PCKD)のための新しい予見型カテゴリーコントラスト学習法を提案する。まず、インスタンスレベルの特徴対応と、インスタンスの特徴とカテゴリ中心の関係の両方の構造的知識を蒸留する。カテゴリ表現を明示的に最適化し、インスタンスとカテゴリの表現を明確に関連付けることができる。
論文参考訳（メタデータ） (2024-10-18T03:31:00Z)
Category-Prompt Refined Feature Learning for Long-Tailed Multi-Label Image Classification [8.139529179222844]
Category-Prompt Refined Feature Learning (CPRFL) は長尺多ラベル画像分類の新しい手法である。 CPRFLは、事前訓練されたCLIPの埋め込みからカテゴリプロンプトを初期化し、カテゴリ固有の視覚表現を分離する。 2つのLCMLCベンチマークにおいて,本手法の有効性を検証し,本手法がベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2024-08-15T12:51:57Z)
Learning to Adapt Category Consistent Meta-Feature of CLIP for Few-Shot Classification [1.6385815610837167]
最近のCLIPに基づく手法では、画像分類タスクにおいてゼロショットと少数ショットのパフォーマンスが期待できる。 LRと高レベルセマンティック表現の相補的な長所を組み合わせたメタ機能適応法(MF-Adapter)を提案する。提案手法は,最先端のCLIP下流数ショット分類法よりも優れており,難易度の高い視覚的分類課題に対して高い性能を示す。
論文参考訳（メタデータ） (2024-07-08T06:18:04Z)
Self-similarity Driven Scale-invariant Learning for Weakly Supervised Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。 PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文参考訳（メタデータ） (2023-02-25T04:48:11Z)
Semantic Cross Attention for Few-shot Learning [9.529264466445236]
本稿では,ラベルテキストのセマンティックな特徴を補助的タスクとして見るためのマルチタスク学習手法を提案する。提案モデルでは,単語埋め込み表現をセマンティックな特徴として用いて,埋め込みネットワークとセマンティックなクロスアテンションモジュールをトレーニングし,セマンティックな特徴を一般的な視覚的モーダルにブリッジする。
論文参考訳（メタデータ） (2022-10-12T15:24:59Z)
Not All Instances Contribute Equally: Instance-adaptive Class Representation Learning for Few-Shot Visual Recognition [94.04041301504567]
少数ショットの視覚認識は、いくつかのラベル付きインスタンスから新しい視覚概念を認識することを指す。本稿では,数ショットの視覚認識を実現するために,インスタンス適応型クラス表現学習ネットワーク(ICRL-Net)と呼ばれる新しいメトリックベースのメタラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2022-09-07T10:00:18Z)
Learning Primitive-aware Discriminative Representations for Few-shot Learning [28.17404445820028]
少ないショットラーニングは、いくつかのラベル付き例で、新しいクラスを容易に認識できる分類器を学習することを目的としている。プリミティブ・マイニング・アンド・リ共振ネットワーク(PMRN)を提案し,プリミティブ・アウェアな表現を学習する。提案手法は,6つの標準ベンチマークの最先端結果を実現する。
論文参考訳（メタデータ） (2022-08-20T16:22:22Z)
Semantic Representation and Dependency Learning for Multi-Label Image Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文参考訳（メタデータ） (2022-04-08T00:55:15Z)
Discovering Relationships between Object Categories via Universal Canonical Maps [80.07703460198198]
変形可能なオブジェクトの複数カテゴリの幾何学を共同で学習する問題に取り組む。近年の研究では、関連オブジェクトのいくつかのカテゴリに対して、統合された高密度ポーズ予測器を学習できることが示されている。改良された対応性は,カテゴリ固有の高密度ポーズ予測器の自然な副産物として自動的に学習できることを示す。
論文参考訳（メタデータ） (2021-06-17T18:38:18Z)
Progressive Co-Attention Network for Fine-grained Visual Classification [20.838908090777885]
きめ細かい視覚分類は、同じカテゴリ内の複数のサブカテゴリに属する画像を認識することを目的としている。既存のほとんどの方法は個々の画像のみを入力とする。そこで本研究では,pca-net(progressive co-attention network)と呼ばれる効果的な手法を提案する。
論文参考訳（メタデータ） (2021-01-21T10:19:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。