論文の概要: On the Transferability of Visual Features in Generalized Zero-Shot
Learning
- arxiv url: http://arxiv.org/abs/2211.12494v1
- Date: Tue, 22 Nov 2022 18:59:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 17:07:41.938975
- Title: On the Transferability of Visual Features in Generalized Zero-Shot
Learning
- Title(参考訳): 一般化ゼロショット学習における視覚特徴の伝達性について
- Authors: Paola Cascante-Bonilla, Leonid Karlinsky, James Seale Smith, Yanjun
Qi, Vicente Ordonez
- Abstract要約: Generalized Zero-Shot Learning (GZSL) は、目に見えないクラスに一般化可能な分類器を訓練することを目的としている。
本研究では,異なる特徴抽出器を用いた場合のGZSL法の有用性について検討する。
また、これらのモデルの事前学習目標、データセット、アーキテクチャ設計が特徴表現能力にどのように影響するかについても検討する。
- 参考スコア(独自算出の注目度): 28.120004119724577
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Generalized Zero-Shot Learning (GZSL) aims to train a classifier that can
generalize to unseen classes, using a set of attributes as auxiliary
information, and the visual features extracted from a pre-trained convolutional
neural network. While recent GZSL methods have explored various techniques to
leverage the capacity of these features, there has been an extensive growth of
representation learning techniques that remain under-explored. In this work, we
investigate the utility of different GZSL methods when using different feature
extractors, and examine how these models' pre-training objectives, datasets,
and architecture design affect their feature representation ability. Our
results indicate that 1) methods using generative components for GZSL provide
more advantages when using recent feature extractors; 2) feature extractors
pre-trained using self-supervised learning objectives and knowledge
distillation provide better feature representations, increasing up to 15%
performance when used with recent GZSL techniques; 3) specific feature
extractors pre-trained with larger datasets do not necessarily boost the
performance of GZSL methods. In addition, we investigate how GZSL methods fare
against CLIP, a more recent multi-modal pre-trained model with strong zero-shot
performance. We found that GZSL tasks still benefit from generative-based GZSL
methods along with CLIP's internet-scale pre-training to achieve
state-of-the-art performance in fine-grained datasets. We release a modular
framework for analyzing representation learning issues in GZSL here:
https://github.com/uvavision/TV-GZSL
- Abstract(参考訳): Generalized Zero-Shot Learning (GZSL) は、属性のセットを補助情報として、事前訓練された畳み込みニューラルネットワークから抽出された視覚的特徴を用いて、目に見えないクラスに一般化可能な分類器を訓練することを目的としている。
近年のgzsl法では,これらの機能の能力を活用するための様々な手法が検討されているが,未検討の表現学習技術の広範な成長がみられている。
本研究では,異なる特徴抽出器を用いたgzsl手法の有用性を調査し,これらのモデルの事前学習目標,データセット,アーキテクチャ設計が特徴表現能力にどのように影響するかを検討する。
私たちの結果は
1)GZSLに生成成分を用いる方法は,最近の特徴抽出器を使用する場合に,より有利である。
2) 自己教師付き学習目標と知識蒸留を用いて事前学習した特徴抽出装置は,より優れた特徴表現を提供し,最近のgzsl技術で使用する場合,最大15%の性能を上げる。
3) より大きなデータセットで事前訓練した特定の特徴抽出器は,必ずしもGZSL法の性能を向上するとは限らない。
さらに,より最近のマルチモーダル事前訓練モデルであるCLIPに対して,GZSL法がどのような効果を発揮するかを検討する。
GZSLタスクは、CLIPのインターネットスケール事前トレーニングとともに生成ベースのGZSLメソッドの恩恵を受け、きめ細かいデータセットで最先端のパフォーマンスを実現する。
GZSLの表現学習問題を解析するためのモジュラーフレームワークを以下にリリースする。
関連論文リスト
- Audio-Visual Generalized Zero-Shot Learning using Pre-Trained Large Multi-Modal Models [53.48409081555687]
本研究では,視覚機能のためのCLIP,音声機能のためのCLAPといった,このような大規模な事前学習モデルについて検討する。
本稿では,フィードフォワードニューラルネットワークのみに依存する,シンプルで効果的なモデルを提案する。
本フレームワークは,VGGSound-GZSL,UCF-GZSL,ActivityNet-GZSL上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-04-09T13:39:37Z) - Disentangled Ontology Embedding for Zero-shot Learning [39.014714187825646]
知識グラフ(KG)とその変種オントロジーは知識表現に広く用いられており、ゼロショット学習(ZSL)の増強に非常に有効であることが示されている。
KGsを利用する既存のZSL法は、KGsで表されるクラス間関係の複雑さを全て無視する。
本稿では,ZSLの拡張に焦点をあて,意味的特性によって導かれる絡み合ったオントロジーの埋め込みを学習することを提案する。
また、生成モデルとグラフ伝搬モデルに基づく2つの新しいZSLソリューションを含む、DOZSLという新しいZSLフレームワークをコントリビュートする。
論文 参考訳(メタデータ) (2022-06-08T08:29:30Z) - Semantic Feature Extraction for Generalized Zero-shot Learning [23.53412767106488]
一般化ゼロショット学習(英: Generalized zero-shot learning, GZSL)は、学習モデルに属性を使って未知のクラスを特定する手法である。
本稿では,GZSL分類性能を大幅に向上させる新しいGZSL手法を提案する。
論文 参考訳(メタデータ) (2021-12-29T09:52:30Z) - Generative Zero-Shot Learning for Semantic Segmentation of 3D Point
Cloud [79.99653758293277]
本稿では,ZSL(Zero-Shot Learning)とGZSL(Generalized ZSL)の両方を3次元データ上に生成する手法を提案する。
インダクティブZSLとインダクティブGZSLの両方に対して,ModelNet40分類における技術状況に到達または向上することを示す。
実験の結果,本手法は強いベースラインよりも優れており,さらに本手法を提案する。
論文 参考訳(メタデータ) (2021-08-13T13:29:27Z) - Multi-Head Self-Attention via Vision Transformer for Zero-Shot Learning [11.66422653137002]
本稿では,ゼロショット学習の課題設定における注意に基づくモデルを提案し,未知のクラス認識に有用な属性を学習する。
本手法では,視覚変換器に適応したアテンション機構を用いて,画像から小さなパッチに分割することで識別属性をキャプチャし,学習する。
論文 参考訳(メタデータ) (2021-07-30T19:08:44Z) - FREE: Feature Refinement for Generalized Zero-Shot Learning [86.41074134041394]
汎用ゼロショット学習(GZSL)は、視覚-意味的領域ギャップと目に見えないバイアスの問題を克服するために多くの努力を払って、大きな進歩を遂げた。
既存のほとんどのメソッドはImageNetでトレーニングされた機能抽出モデルを直接使用しており、ImageNetとGZSLベンチマークのデータセット間のバイアスを無視している。
本稿では,この問題に対処するために,汎用ゼロショット学習(FREE)のための特徴改善という,シンプルで効果的なGZSL法を提案する。
論文 参考訳(メタデータ) (2021-07-29T08:11:01Z) - Attribute-Modulated Generative Meta Learning for Zero-Shot
Classification [52.64680991682722]
ゼロショット学習のためのAttribute-Modulated GenerAtive Meta-modelを提案する。
本モデルは属性対応変調ネットワークと属性対応生成ネットワークから構成される。
実験により,AMAZはZSLで3.8%,ZSLで5.1%改善し,ZSL設定を一般化した。
論文 参考訳(メタデータ) (2021-04-22T04:16:43Z) - Task Aligned Generative Meta-learning for Zero-shot Learning [64.16125851588437]
ゼロショット学習のためのタスク整合型ジェネラティブメタラーニングモデル(TGMZ)の提案
TGMZはバイアスのあるトレーニングを緩和し、メタZSLが多様な分布を含む現実世界のデータセットに対応できるようにする。
最先端アルゴリズムとの比較により,awa1,awa2,cub,apyデータセット上でtgmzが達成した2.1%,3.0%,2.5%,7.6%の改善が示された。
論文 参考訳(メタデータ) (2021-03-03T05:18:36Z) - OntoZSL: Ontology-enhanced Zero-shot Learning [19.87808305218359]
Zero-shot Learning(ZSL)の実装の鍵は、クラス間の意味的な関係を構築するクラスの以前の知識を活用することです。
本稿では,zslのクラス間関係をモデル化するために,より豊かで競争力の高い事前知識を探索する。
目に見えないクラス間のデータ不均衡に対処するため,GAN(Generative Adversarial Networks)を用いた生成型ZSLフレームワークを開発した。
論文 参考訳(メタデータ) (2021-02-15T04:39:58Z) - End-to-end Generative Zero-shot Learning via Few-shot Learning [76.9964261884635]
ゼロショット学習(ZSL)の最先端アプローチでは、生成ネットをトレーニングし、提供されたメタデータに条件付きサンプルを合成する。
本稿では,このような手法をバックボーンとして使用し,合成した出力をFew-Shot Learningアルゴリズムに供給するエンドツーエンド生成ZSLフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-08T17:35:37Z) - A Biologically Inspired Feature Enhancement Framework for Zero-Shot
Learning [18.348568695197553]
本稿では,ゼロショット学習(ZSL)アルゴリズムのための生物学的にインスパイアされた機能拡張フレームワークを提案する。
具体的には、補助データセットを用いてZSLモデルの特徴抽出器を強化する2チャンネル学習フレームワークを設計する。
提案手法は,ZSLモデルの有効性を効果的に向上し,3つのベンチマークZSLタスクの最先端結果が得られる。
論文 参考訳(メタデータ) (2020-05-13T13:25:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。