論文の概要: Zero-Shot Learning from Adversarial Feature Residual to Compact Visual
Feature
- arxiv url: http://arxiv.org/abs/2008.12962v1
- Date: Sat, 29 Aug 2020 11:16:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 17:21:45.302088
- Title: Zero-Shot Learning from Adversarial Feature Residual to Compact Visual
Feature
- Title(参考訳): 敵対的特徴からコンパクトな視覚特徴へのゼロショット学習
- Authors: Bo Liu, Qiulei Dong, Zhanyi Hu
- Abstract要約: ゼロショット学習(ZSL)のためのコンパクトなセマンティックな視覚特徴を合成する新しい対向ネットワークを提案する。
残差発生器は、プロトタイプ予測器を介して予測される視覚的プロトタイプと統合された視覚的特徴残差を生成する。
判別器は、既存の分類CNNから抽出された実物と合成視覚特徴を区別する。
- 参考スコア(独自算出の注目度): 26.89763840782029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, many zero-shot learning (ZSL) methods focused on learning
discriminative object features in an embedding feature space, however, the
distributions of the unseen-class features learned by these methods are prone
to be partly overlapped, resulting in inaccurate object recognition. Addressing
this problem, we propose a novel adversarial network to synthesize compact
semantic visual features for ZSL, consisting of a residual generator, a
prototype predictor, and a discriminator. The residual generator is to generate
the visual feature residual, which is integrated with a visual prototype
predicted via the prototype predictor for synthesizing the visual feature. The
discriminator is to distinguish the synthetic visual features from the real
ones extracted from an existing categorization CNN. Since the generated
residuals are generally numerically much smaller than the distances among all
the prototypes, the distributions of the unseen-class features synthesized by
the proposed network are less overlapped. In addition, considering that the
visual features from categorization CNNs are generally inconsistent with their
semantic features, a simple feature selection strategy is introduced for
extracting more compact semantic visual features. Extensive experimental
results on six benchmark datasets demonstrate that our method could achieve a
significantly better performance than existing state-of-the-art methods by
1.2-13.2% in most cases.
- Abstract(参考訳): 近年,組込み特徴空間における識別対象特徴の学習に焦点をあてたゼロショット学習(ZSL)手法が数多く行われているが,これらの手法によって学習される未確認クラスの特徴の分布は部分的に重なりがちであり,不正確な物体認識をもたらす。
この問題に対処するため,我々は,ZSLのコンパクトな意味的視覚特徴を合成する,新たな敵対的ネットワークを提案する。
残余生成器は、視覚特徴の合成のためのプロトタイプ予測器を介して予測される視覚プロトタイプと統合される視覚特徴残差を生成する。
識別器は、既存の分類cnnから抽出された実際の視覚特徴と合成視覚特徴を区別する。
生成した残差は, 試作機間距離よりも数値的にはるかに小さいため, 提案したネットワークで合成した未確認特徴の分布は重なりが小さい。
また,分類CNNの視覚的特徴が意味的特徴と一致していないことを考えると,よりコンパクトな視覚的特徴を抽出するための単純な特徴選択戦略が導入された。
6つのベンチマークデータセットの広範な実験結果から,本手法は既存の最先端手法よりも1.2~13.2%の精度で性能が向上することが分かった。
関連論文リスト
- Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - Hierarchical Visual Primitive Experts for Compositional Zero-Shot
Learning [52.506434446439776]
合成ゼロショット学習(CZSL)は、既知のプリミティブ(属性とオブジェクト)の事前知識で構成を認識することを目的としている。
このような問題に対処するために,コンポジショントランスフォーマー(CoT)と呼ばれるシンプルでスケーラブルなフレームワークを提案する。
提案手法は,MIT-States,C-GQA,VAW-CZSLなど,いくつかのベンチマークでSoTA性能を実現する。
論文 参考訳(メタデータ) (2023-08-08T03:24:21Z) - An Integral Projection-based Semantic Autoencoder for Zero-Shot Learning [0.46644955105516456]
ゼロショット学習(ZSL)分類は、トレーニングセットに含まれないクラス(ラベル)を分類または予測する(見えないクラス)。
近年の研究では、エンコーダが視覚的特徴空間をセマンティック空間に埋め込み、デコーダが元の視覚的特徴空間を再構成する、異なる意味的オートエンコーダ(SAE)モデルが提案されている。
本稿では,意味空間でベクトル化された視覚的特徴空間を潜在表現空間に投影する統合投影型セマンティックオートエンコーダ(IP-SAE)を提案する。
論文 参考訳(メタデータ) (2023-06-26T12:06:20Z) - Evolving Semantic Prototype Improves Generative Zero-Shot Learning [73.07035277030573]
ゼロショット学習(ZSL)では、生成法は事前に定義されたセマンティックプロトタイプに基づいてクラス関連サンプル特徴を合成する。
各クラスの事前定義されたセマンティックプロトタイプは、実際のセマンティックプロトタイプと正確に一致しない。
本稿では,経験的に定義された意味的プロトタイプと,クラス関連特徴合成のための実際のプロトタイプを整合させる動的意味的プロトタイプ(DSP)法を提案する。
論文 参考訳(メタデータ) (2023-06-12T08:11:06Z) - Semantic Prompt for Few-Shot Image Recognition [76.68959583129335]
本稿では,数ショット学習のための新しいセマンティック・プロンプト(SP)手法を提案する。
提案手法は,1ショットの学習精度を平均3.67%向上させることにより,有望な結果が得られる。
論文 参考訳(メタデータ) (2023-03-24T16:32:19Z) - Stochastic Deep Networks with Linear Competing Units for Model-Agnostic
Meta-Learning [4.97235247328373]
本研究は,LWTA(Local winner-takes-all)アクティベーションを伴うディープネットワークを考慮したメタラーニング(ML)に対処する。
このタイプのネットワークユニットは、ユニットが1つのユニットだけがゼロでない出力を生成するブロックに編成されるため、各モデルレイヤからスパース表現が生成される。
提案手法は,数ショット画像の分類と回帰実験における最先端の予測精度と,アクティブな学習環境における予測誤差の低減を実現する。
論文 参考訳(メタデータ) (2022-08-02T16:19:54Z) - Boosting Generative Zero-Shot Learning by Synthesizing Diverse Features
with Attribute Augmentation [21.72622601533585]
多様な特徴を合成してゼロショット学習(ZSL)を促進する新しいフレームワークを提案する。
本手法は,視覚特徴の実際の分布をシミュレートするために,拡張意味属性を用いて生成モデルを訓練する。
提案したモデルを4つのベンチマークデータセット上で評価し,現状に対する大幅な性能改善を観察した。
論文 参考訳(メタデータ) (2021-12-23T14:32:51Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。