論文の概要: Learning Primitive-aware Discriminative Representations for Few-shot
Learning
- arxiv url: http://arxiv.org/abs/2208.09717v2
- Date: Wed, 14 Jun 2023 16:54:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 03:55:25.825723
- Title: Learning Primitive-aware Discriminative Representations for Few-shot
Learning
- Title(参考訳): 少数ショット学習のためのプリミティブアウェア識別表現の学習
- Authors: Jianpeng Yang, Yuhang Niu, Xuemei Xie, Guangming Shi
- Abstract要約: 少ないショットラーニングは、いくつかのラベル付き例で、新しいクラスを容易に認識できる分類器を学習することを目的としている。
プリミティブ・マイニング・アンド・リ共振ネットワーク(PMRN)を提案し,プリミティブ・アウェアな表現を学習する。
提案手法は,6つの標準ベンチマークの最先端結果を実現する。
- 参考スコア(独自算出の注目度): 28.17404445820028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot learning (FSL) aims to learn a classifier that can be easily adapted
to recognize novel classes with only a few labeled examples. Some recent work
about FSL has yielded promising classification performance, where the
image-level feature is used to calculate the similarity among samples for
classification. However, the image-level feature ignores abundant fine-grained
and structural in-formation of objects that may be transferable and consistent
between seen and unseen classes. How can humans easily identify novel classes
with several sam-ples? Some study from cognitive science argues that humans can
recognize novel categories through primitives. Although base and novel
categories are non-overlapping, they can share some primitives in common.
Inspired by above re-search, we propose a Primitive Mining and Reasoning
Network (PMRN) to learn primitive-aware representations based on metric-based
FSL model. Concretely, we first add Self-supervision Jigsaw task (SSJ) for
feature extractor parallelly, guiding the model to encode visual pattern
corresponding to object parts into fea-ture channels. To further mine
discriminative representations, an Adaptive Chan-nel Grouping (ACG) method is
applied to cluster and weight spatially and se-mantically related visual
patterns to generate a group of visual primitives. To fur-ther enhance the
discriminability and transferability of primitives, we propose a visual
primitive Correlation Reasoning Network (CRN) based on graph convolu-tional
network to learn abundant structural information and internal correlation among
primitives. Finally, a primitive-level metric is conducted for classification
in a meta-task based on episodic training strategy. Extensive experiments show
that our method achieves state-of-the-art results on six standard benchmarks.
- Abstract(参考訳): FSL (Few-shot Learning) は、いくつかのラベル付き例で簡単に新しいクラスを認識できる分類器を学習することを目的としている。
FSLに関する最近の研究は有望な分類性能をもたらし、画像レベルの特徴を使って分類のためのサンプル間の類似性を計算する。
しかし、画像レベルの特徴は、見知らぬクラスと見えないクラスの間で転送可能で一貫性のあるオブジェクトの微細で構造的なインフォームを無視する。
人間はどのようにして複数のサムプルを持つ新しいクラスを識別できるのか?
認知科学からのいくつかの研究は、人間が原始を通して新しいカテゴリーを認識できると主張している。
基本と新規のカテゴリは重複しないが、共通のプリミティブを共有することができる。
上記の再調査に触発されて,計量に基づくfslモデルに基づく原始認識表現を学習する原始的マイニング・推論ネットワーク (pmrn) を提案する。
具体的には,機能抽出にSSJ(Self-supervision Jigsaw Task)を並列に追加し,オブジェクトの部分に対応する視覚パターンをフェースチャネルにエンコードするモデルを導出する。
さらに識別表現をマイニングするために、アダプティブチャンネルグルーピング(acg)法をクラスタに適用し、空間的およびセマント的に関連した視覚パターンを重み付けし、視覚プリミティブのグループを生成する。
プリミティブの識別可能性と伝達可能性を高めるために,グラフコンボリューションネットワークに基づく視覚的プリミティブ相関推論ネットワーク(CRN)を提案し,プリミティブ間の豊富な構造情報と内部相関を学習する。
最後に、エピソディックトレーニング戦略に基づいてメタタスクの分類のための原始レベル計量を行う。
広範な実験により,6つの標準ベンチマークで最新の結果が得られた。
関連論文リスト
- Preview-based Category Contrastive Learning for Knowledge Distillation [53.551002781828146]
知識蒸留(PCKD)のための新しい予見型カテゴリーコントラスト学習法を提案する。
まず、インスタンスレベルの特徴対応と、インスタンスの特徴とカテゴリ中心の関係の両方の構造的知識を蒸留する。
カテゴリ表現を明示的に最適化し、インスタンスとカテゴリの表現を明確に関連付けることができる。
論文 参考訳(メタデータ) (2024-10-18T03:31:00Z) - Queryable Prototype Multiple Instance Learning with Vision-Language Models for Incremental Whole Slide Image Classification [10.667645628712542]
本稿では, 逐次WSI分類に特化して設計された, Queryable Prototype Multiple Instance Learning (QPMIL-VL) を用いた視覚言語ベースのフレームワークを提案する。
TCGAデータセットの4つの実験により、我々のQPMIL-VLフレームワークが漸進的なWSI分類に有効であることが示された。
論文 参考訳(メタデータ) (2024-10-14T14:49:34Z) - Few-Shot Class-Incremental Learning via Training-Free Prototype
Calibration [67.69532794049445]
既存のメソッドでは、新しいクラスのサンプルをベースクラスに誤分類する傾向があり、新しいクラスのパフォーマンスが低下する。
我々は,新しいクラスの識別性を高めるため,簡易かつ効果的なトレーニング-フレア・カロブラシアン (TEEN) 戦略を提案する。
論文 参考訳(メタデータ) (2023-12-08T18:24:08Z) - ECKPN: Explicit Class Knowledge Propagation Network for Transductive
Few-shot Learning [53.09923823663554]
クラスレベルの知識は、ほんの一握りのサンプルから人間が容易に学習することができる。
本稿では,この問題に対処する明示的クラス知識伝達ネットワーク(ECKPN)を提案する。
筆者らは,4つの数ショット分類ベンチマークについて広範な実験を行い,提案したECKPNが最先端の手法よりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2021-06-16T02:29:43Z) - GAN for Vision, KG for Relation: a Two-stage Deep Network for Zero-shot
Action Recognition [33.23662792742078]
ゼロショット動作認識のための2段階のディープニューラルネットワークを提案する。
サンプリング段階では,授業の動作特徴と単語ベクトルによって訓練されたGAN(Generative Adversarial Network)を利用する。
分類段階において、アクションクラスの単語ベクトルと関連するオブジェクトの関係に基づいて知識グラフを構築する。
論文 参考訳(メタデータ) (2021-05-25T09:34:42Z) - Semi-Supervised Few-Shot Classification with Deep Invertible Hybrid
Models [4.189643331553922]
半教師付き小ショット分類のための潜在空間レベルで識別学習と生成学習を統合するディープ・インバーチブルハイブリッドモデルを提案する。
我々の主な独創性は、これらのコンポーネントを潜在空間レベルで統合することであり、過度な適合を防ぐのに有効である。
論文 参考訳(メタデータ) (2021-05-22T05:55:16Z) - Adaptive Prototypical Networks with Label Words and Joint Representation
Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。
クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。
FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文 参考訳(メタデータ) (2021-01-10T11:25:42Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Dataset Bias in Few-shot Image Recognition [57.25445414402398]
まず,基本カテゴリから学習した伝達可能能力の影響について検討する。
第2に、データセット構造と異なる少数ショット学習方法から、異なるデータセットのパフォーマンス差について検討する。
論文 参考訳(メタデータ) (2020-08-18T14:46:23Z) - Compositional Few-Shot Recognition with Primitive Discovery and
Enhancing [43.478770119996184]
少数のトレーニングサンプルしか持たない新しいクラスを認識することを目的としていない。
人間はサンプルの少ない新しいクラスを容易に認識できる。
本稿では,重要なプリミティブからなる特徴表現を学習するためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-12T21:01:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。