論文の概要: Subspace Representation Learning for Few-shot Image Classification
- arxiv url: http://arxiv.org/abs/2105.00379v2
- Date: Wed, 5 May 2021 01:57:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-06 13:01:56.667131
- Title: Subspace Representation Learning for Few-shot Image Classification
- Title(参考訳): 画像分類のための部分空間表現学習
- Authors: Ting-Yao Hu, Zhi-Qi Cheng, Alexander G. Hauptmann
- Abstract要約: 少数の画像分類タスクに対処するサブスペース表現学習フレームワークを提案する。
画像を表すためにローカルCNN機能空間のサブスペースを利用し、重み付きサブスペース距離(WSD)に従って2つの画像間の類似度を測定します。
- 参考スコア(独自算出の注目度): 105.7788602565317
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we propose a subspace representation learning (SRL) framework
to tackle few-shot image classification tasks. It exploits a subspace in local
CNN feature space to represent an image, and measures the similarity between
two images according to a weighted subspace distance (WSD). When K images are
available for each class, we develop two types of template subspaces to
aggregate K-shot information: the prototypical subspace (PS) and the
discriminative subspace (DS). Based on the SRL framework, we extend metric
learning based techniques from vector to subspace representation. While most
previous works adopted global vector representation, using subspace
representation can effectively preserve the spatial structure, and diversity
within an image. We demonstrate the effectiveness of the SRL framework on three
public benchmark datasets: MiniImageNet, TieredImageNet and Caltech-UCSD
Birds-200-2011 (CUB), and the experimental results illustrate
competitive/superior performance of our method compared to the previous
state-of-the-art.
- Abstract(参考訳): 本稿では,少数の画像分類タスクに対処する部分空間表現学習(SRL)フレームワークを提案する。
局所CNN特徴空間内の部分空間を利用して画像を表現し、重み付き部分空間距離(WSD)に応じて2つの画像間の類似度を測定する。
K画像が各クラスで利用できる場合、Kショット情報を集約するテンプレート部分空間として、プロトタイプ部分空間(PS)と識別部分空間(DS)の2種類を開発する。
SRLフレームワークに基づいて,ベクトルから部分空間表現への距離学習手法を拡張した。
以前の作品では大域的なベクトル表現が採用されていたが、部分空間表現を用いることで、画像内の空間構造や多様性を効果的に保存することができる。
miniimagenet,tieredimagenet,caltech-ucsd birds-200-2011 (cub) の3つのベンチマークデータセットにおいて,srlフレームワークの有効性を実証し,本手法のこれまでの最新データと比較した性能と性能を実験的に示した。
関連論文リスト
- Finetuning CLIP to Reason about Pairwise Differences [52.028073305958074]
本稿では,CLIPのような視覚言語モデルの学習手法を提案する。
我々はまず,ある属性による画像のランク付け能力を大幅に向上させることを実証した。
また、得られる埋め込みは埋め込み空間においてより大きな幾何学的性質に従うことを示す。
論文 参考訳(メタデータ) (2024-09-15T13:02:14Z) - Selective Vision-Language Subspace Projection for Few-shot CLIP [55.361337202198925]
SSP (Selective Vision-Language Subspace Projection) という手法を導入する。
SSPはローカルな画像特徴を取り入れ、それらをブリッジとして利用し、画像とテキストのペア間のアライメントを強化する。
提案手法では,学習不要な行列計算しか必要とせず,高度なCLIPベースの数ショット学習フレームワークにシームレスに統合できる。
論文 参考訳(メタデータ) (2024-07-24T03:45:35Z) - Spatial Latent Representations in Generative Adversarial Networks for
Image Generation [0.0]
StyleGAN2 に対して空間潜在空間の族を定義する。
我々の空間は画像操作や意味情報のエンコードに有効であることを示す。
論文 参考訳(メタデータ) (2023-03-25T20:01:11Z) - Mining Contextual Information Beyond Image for Semantic Segmentation [37.783233906684444]
セマンティックイメージセグメンテーションにおける文脈集約問題について検討する。
個々の画像以外の文脈情報をマイニングして、ピクセル表現をさらに強化することを提案する。
提案手法は,既存のセグメンテーションフレームワークに強制的に組み込むことができる。
論文 参考訳(メタデータ) (2021-08-26T14:34:23Z) - Low-Rank Subspaces in GANs [101.48350547067628]
この研究は、GAN生成をより正確に制御できる低ランクな部分空間を導入している。
LowRankGAN は属性多様体の低次元表現を見つけることができる。
さまざまなデータセットでトレーニングされた最先端のGANモデル(StyleGAN2やBigGANなど)の実験は、私たちのLowRankGANの有効性を示しています。
論文 参考訳(メタデータ) (2021-06-08T16:16:32Z) - Isometric Propagation Network for Generalized Zero-shot Learning [72.02404519815663]
一般的な戦略は、クラス属性の意味空間と、見たクラスとそのデータに基づいて画像の視覚空間とのマッピングを学ぶことである。
本稿では,各空間内のクラス間の関係を強化し,2つの空間におけるクラス依存性を整合させるIsometric propagation Network (IPN)を提案する。
IPNは3つの人気のあるゼロショット学習ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-02-03T12:45:38Z) - DeepEMD: Differentiable Earth Mover's Distance for Few-Shot Learning [122.51237307910878]
我々は,画像領域間の最適なマッチングの新しい視点から,少数ショット画像分類法を開発した。
我々は、高密度画像表現間の構造距離を計算するために、Earth Mover's Distance (EMD) を用いている。
定式化において重要な要素の重みを生成するために,我々は相互参照機構を設計する。
論文 参考訳(メタデータ) (2020-03-15T08:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。