論文の概要: Complementing Representation Deficiency in Few-shot Image
Classification: A Meta-Learning Approach
- arxiv url: http://arxiv.org/abs/2007.10778v1
- Date: Tue, 21 Jul 2020 13:25:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 04:20:37.045929
- Title: Complementing Representation Deficiency in Few-shot Image
Classification: A Meta-Learning Approach
- Title(参考訳): Few-shot画像分類における表現不足の補足:メタラーニングアプローチ
- Authors: Xian Zhong, Cheng Gu, Wenxin Huang, Lin Li, Shuqin Chen and Chia-Wen
Lin
- Abstract要約: 本稿では,MCRNetを用いたメタラーニング手法を提案する。
特に、潜時空間を埋め込んで、潜時符号を余分な表現情報で再構成し、表現不足を補完する。
我々のエンドツーエンドフレームワークは、3つの標準的な数ショット学習データセット上の画像分類における最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 27.350615059290348
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot learning is a challenging problem that has attracted more and more
attention recently since abundant training samples are difficult to obtain in
practical applications. Meta-learning has been proposed to address this issue,
which focuses on quickly adapting a predictor as a base-learner to new tasks,
given limited labeled samples. However, a critical challenge for meta-learning
is the representation deficiency since it is hard to discover common
information from a small number of training samples or even one, as is the
representation of key features from such little information. As a result, a
meta-learner cannot be trained well in a high-dimensional parameter space to
generalize to new tasks. Existing methods mostly resort to extracting less
expressive features so as to avoid the representation deficiency. Aiming at
learning better representations, we propose a meta-learning approach with
complemented representations network (MCRNet) for few-shot image
classification. In particular, we embed a latent space, where latent codes are
reconstructed with extra representation information to complement the
representation deficiency. Furthermore, the latent space is established with
variational inference, collaborating well with different base-learners, and can
be extended to other models. Finally, our end-to-end framework achieves the
state-of-the-art performance in image classification on three standard few-shot
learning datasets.
- Abstract(参考訳): 近年,多量のトレーニングサンプルの入手が困難であることから,難易度の高い学習課題が注目されている。
この問題に対処するためにメタラーニングが提案されており、限定されたラベル付きサンプルから、予測器を新しいタスクのベースラーナーとして迅速に適応することに焦点を当てている。
しかし、メタラーニングにおける重要な課題は、少数のトレーニングサンプルから共通情報を発見できないことや、そのような少ない情報から重要な特徴を表現することなど、表現不足である。
その結果、メタリーナーは、新しいタスクに一般化するために高次元のパラメータ空間でうまく訓練できない。
既存の手法では、表現不足を避けるために表現力の低い特徴を抽出することがほとんどである。
より優れた表現の学習を目的としたメタ学習手法として,画像分類のための補完表現ネットワーク(MCRNet)を提案する。
特に、潜在コードは表現不足を補うために余分な表現情報と共に再構成される潜在空間を埋め込みます。
さらに、潜在空間は変分推論によって確立され、異なるベースリーナーとうまく協調し、他のモデルにも拡張することができる。
最後に、我々のエンドツーエンドフレームワークは、3つの標準的な数ショット学習データセット上の画像分類における最先端のパフォーマンスを実現する。
関連論文リスト
- Intra-task Mutual Attention based Vision Transformer for Few-Shot Learning [12.5354658533836]
人間は、ほんのわずかの例に晒された後に、新しい、目に見えない画像を正確に分類する能力を持っている。
人工ニューラルネットワークモデルでは、限られたサンプルを持つ2つのイメージを区別する最も関連性の高い特徴を決定することが課題である。
本稿では,サポートとクエリサンプルをパッチに分割するタスク内相互注意手法を提案する。
論文 参考訳(メタデータ) (2024-05-06T02:02:57Z) - SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for
Few-shot Image Classification [84.05253637260743]
本稿では,セマンティック誘導視覚適応(SgVA)と呼ばれる新しいフレームワークを提案する。
SgVAは、視覚特異的のコントラスト損失、クロスモーダルのコントラスト損失、暗黙の知識蒸留を包括的に利用することで、識別的なタスク固有の視覚特徴を生成する。
13のデータセットの最先端の結果は、適応された視覚的特徴が、クロスモーダルな特徴を補完し、少数の画像分類を改善することを実証している。
論文 参考訳(メタデータ) (2022-11-28T14:58:15Z) - An Empirical Investigation of Representation Learning for Imitation [76.48784376425911]
視覚、強化学習、NLPにおける最近の研究は、補助的な表現学習の目的が、高価なタスク固有の大量のデータの必要性を減らすことを示している。
本稿では,表現学習アルゴリズムを構築するためのモジュラーフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-16T11:23:42Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Few-shot Classification via Adaptive Attention [93.06105498633492]
ごく少数の参照サンプルに基づいて,クエリサンプル表現を最適化し,高速に適応する新しい数ショット学習手法を提案する。
実験で実証したように,提案モデルでは,様々なベンチマーク数ショット分類と微粒化認識データセットを用いて,最先端の分類結果を達成している。
論文 参考訳(メタデータ) (2020-08-06T05:52:59Z) - Towards Cross-Granularity Few-Shot Learning: Coarse-to-Fine
Pseudo-Labeling with Visual-Semantic Meta-Embedding [13.063136901934865]
少ないショットラーニングは、テスト時に少数のサンプルしか持たない、新しいカテゴリに迅速に適応することを目的としている。
本稿では,より困難なシナリオ,すなわちクロスグラニュラリティ・グラニュラリティ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラ
画像埋め込みの類似性に応じて,各粗いクラスを擬似微細クラスにグリーディクラスタリングすることで,詳細なデータ分布を近似する。
論文 参考訳(メタデータ) (2020-07-11T03:44:21Z) - Looking back to lower-level information in few-shot learning [4.873362301533825]
本稿では,隠れたニューラルネットワーク層の特徴埋め込みを低レベル支援情報として活用し,分類精度を向上させることを提案する。
筆者らは,MiniImageNet と tieredImageNet という2つの人気の数点学習データセットを用いた実験を行い,この手法がネットワークの低レベル情報を利用して最先端の分類性能を向上できることを示した。
論文 参考訳(メタデータ) (2020-05-27T20:32:13Z) - Semi-supervised few-shot learning for medical image segmentation [21.349705243254423]
大規模な注釈付きデータセットの必要性を緩和する最近の試みは、数ショットの学習パラダイムの下でトレーニング戦略を開発した。
セマンティックセグメンテーションのための新しい数発の学習フレームワークを提案し,各エピソードでラベルのない画像も利用できるようにした。
エピソードトレーニングにおけるラベルなしのサロゲートタスクを含めると、より強力な特徴表現がもたらされることを示す。
論文 参考訳(メタデータ) (2020-03-18T20:37:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。