論文の概要: Learning Primitive-aware Discriminative Representations for FSL
- arxiv url: http://arxiv.org/abs/2208.09717v1
- Date: Sat, 20 Aug 2022 16:22:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 13:16:28.214470
- Title: Learning Primitive-aware Discriminative Representations for FSL
- Title(参考訳): FSLのための原始認識型識別表現の学習
- Authors: Jianpeng Yang
- Abstract要約: Few-shot Learningは、クラスごとにラベル付き例を数個だけ与えて、新しいクラスを認識するのに容易に適応できる分類器を学習することを目的としている。
近年のメトリクスベースの手法は,画像レベルの特徴に基づく有望な性能を実現している。
認知科学におけるいくつかの研究は、人間が学習されたプリミティブを持つ新しいクラスを認識できると主張している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot learning (FSL) aims to learn a classifier that can be easily adapted
to recognize novel classes,given only a few labeled examples per class.Limited
data keep this task challenging for deep learning.Recent metric-based methods
has achieved promising performance based on image-level features.However,these
global features ignore abundant local and structural information that is
transferable and consistent between seen and unseen classes.Some study in
cognitive science argue that humans can recognize novel classes with the
learned primitives.We expect to mine both transferable and discriminative
representation from base classes and adopt them to recognize novel
classes.Building on the episodic training mechanism,We propose a Primitive
Mining and Reasoning Network(PMRN) to learn primitive-aware representation in
an end-to-end manner for metric-based FSL model.We first add self-supervision
auxiliary task,forcing feature extractor to learn tvisual pattern corresponding
to primitives.To further mine and produce transferable primitive-aware
representations,we design an Adaptive Channel Grouping(ACG)module to synthesize
a set of visual primitives from object embedding by enhancing informative
channel maps while suppressing useless ones. Based on the learned primitive
feature,a Semantic Correlation Reasoning (SCR) module is proposed to capture
internal relations among them.Finally,we learn the task-specific importance of
primitives and conduct primitive-level metric based on the task-specific
attention feature.Extensive experiments show that our method achieves
state-of-the-art results on six standard benchmarks.
- Abstract(参考訳): Few-shot learning (FSL) aims to learn a classifier that can be easily adapted to recognize novel classes,given only a few labeled examples per class.Limited data keep this task challenging for deep learning.Recent metric-based methods has achieved promising performance based on image-level features.However,these global features ignore abundant local and structural information that is transferable and consistent between seen and unseen classes.Some study in cognitive science argue that humans can recognize novel classes with the learned primitives.We expect to mine both transferable and discriminative representation from base classes and adopt them to recognize novel classes.Building on the episodic training mechanism,We propose a Primitive Mining and Reasoning Network(PMRN) to learn primitive-aware representation in an end-to-end manner for metric-based FSL model.We first add self-supervision auxiliary task,forcing feature extractor to learn tvisual pattern corresponding to primitives.To further mine and produce transferable primitive-aware representations,we design an Adaptive Channel Grouping(ACG)module to synthesize a set of visual primitives from object embedding by enhancing informative channel maps while suppressing useless ones.
学習したプリミティブ特徴に基づいて,それらの内部関係を捉えるためのセマンティック相関推論(SCR)モジュールを提案し,タスク固有の注意機能に基づいて,プリミティブのタスク固有の重要性を学習し,プリミティブレベルのメトリクスを実行する。
関連論文リスト
- Preview-based Category Contrastive Learning for Knowledge Distillation [53.551002781828146]
知識蒸留(PCKD)のための新しい予見型カテゴリーコントラスト学習法を提案する。
まず、インスタンスレベルの特徴対応と、インスタンスの特徴とカテゴリ中心の関係の両方の構造的知識を蒸留する。
カテゴリ表現を明示的に最適化し、インスタンスとカテゴリの表現を明確に関連付けることができる。
論文 参考訳(メタデータ) (2024-10-18T03:31:00Z) - Queryable Prototype Multiple Instance Learning with Vision-Language Models for Incremental Whole Slide Image Classification [10.667645628712542]
本稿では, 逐次WSI分類に特化して設計された, Queryable Prototype Multiple Instance Learning (QPMIL-VL) を用いた視覚言語ベースのフレームワークを提案する。
TCGAデータセットの4つの実験により、我々のQPMIL-VLフレームワークが漸進的なWSI分類に有効であることが示された。
論文 参考訳(メタデータ) (2024-10-14T14:49:34Z) - Few-Shot Class-Incremental Learning via Training-Free Prototype
Calibration [67.69532794049445]
既存のメソッドでは、新しいクラスのサンプルをベースクラスに誤分類する傾向があり、新しいクラスのパフォーマンスが低下する。
我々は,新しいクラスの識別性を高めるため,簡易かつ効果的なトレーニング-フレア・カロブラシアン (TEEN) 戦略を提案する。
論文 参考訳(メタデータ) (2023-12-08T18:24:08Z) - ECKPN: Explicit Class Knowledge Propagation Network for Transductive
Few-shot Learning [53.09923823663554]
クラスレベルの知識は、ほんの一握りのサンプルから人間が容易に学習することができる。
本稿では,この問題に対処する明示的クラス知識伝達ネットワーク(ECKPN)を提案する。
筆者らは,4つの数ショット分類ベンチマークについて広範な実験を行い,提案したECKPNが最先端の手法よりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2021-06-16T02:29:43Z) - GAN for Vision, KG for Relation: a Two-stage Deep Network for Zero-shot
Action Recognition [33.23662792742078]
ゼロショット動作認識のための2段階のディープニューラルネットワークを提案する。
サンプリング段階では,授業の動作特徴と単語ベクトルによって訓練されたGAN(Generative Adversarial Network)を利用する。
分類段階において、アクションクラスの単語ベクトルと関連するオブジェクトの関係に基づいて知識グラフを構築する。
論文 参考訳(メタデータ) (2021-05-25T09:34:42Z) - Semi-Supervised Few-Shot Classification with Deep Invertible Hybrid
Models [4.189643331553922]
半教師付き小ショット分類のための潜在空間レベルで識別学習と生成学習を統合するディープ・インバーチブルハイブリッドモデルを提案する。
我々の主な独創性は、これらのコンポーネントを潜在空間レベルで統合することであり、過度な適合を防ぐのに有効である。
論文 参考訳(メタデータ) (2021-05-22T05:55:16Z) - Adaptive Prototypical Networks with Label Words and Joint Representation
Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。
クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。
FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文 参考訳(メタデータ) (2021-01-10T11:25:42Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Dataset Bias in Few-shot Image Recognition [57.25445414402398]
まず,基本カテゴリから学習した伝達可能能力の影響について検討する。
第2に、データセット構造と異なる少数ショット学習方法から、異なるデータセットのパフォーマンス差について検討する。
論文 参考訳(メタデータ) (2020-08-18T14:46:23Z) - Compositional Few-Shot Recognition with Primitive Discovery and
Enhancing [43.478770119996184]
少数のトレーニングサンプルしか持たない新しいクラスを認識することを目的としていない。
人間はサンプルの少ない新しいクラスを容易に認識できる。
本稿では,重要なプリミティブからなる特徴表現を学習するためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-12T21:01:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。