論文の概要: Multi-Head Self-Attention via Vision Transformer for Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2108.00045v1
- Date: Fri, 30 Jul 2021 19:08:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:34:51.442962
- Title: Multi-Head Self-Attention via Vision Transformer for Zero-Shot Learning
- Title(参考訳): ゼロショット学習のための視覚トランスフォーマによる多頭セルフアテンション
- Authors: Faisal Alamri and Anjan Dutta
- Abstract要約: 本稿では,ゼロショット学習の課題設定における注意に基づくモデルを提案し,未知のクラス認識に有用な属性を学習する。
本手法では,視覚変換器に適応したアテンション機構を用いて,画像から小さなパッチに分割することで識別属性をキャプチャし,学習する。
- 参考スコア(独自算出の注目度): 11.66422653137002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero-Shot Learning (ZSL) aims to recognise unseen object classes, which are
not observed during the training phase. The existing body of works on ZSL
mostly relies on pretrained visual features and lacks the explicit attribute
localisation mechanism on images. In this work, we propose an attention-based
model in the problem settings of ZSL to learn attributes useful for unseen
class recognition. Our method uses an attention mechanism adapted from Vision
Transformer to capture and learn discriminative attributes by splitting images
into small patches. We conduct experiments on three popular ZSL benchmarks
(i.e., AWA2, CUB and SUN) and set new state-of-the-art harmonic mean results
{on all the three datasets}, which illustrate the effectiveness of our proposed
method.
- Abstract(参考訳): Zero-Shot Learning (ZSL) は、未確認のオブジェクトクラスを認識することを目的としている。
既存のzslの作業は、主に事前訓練された視覚機能に依存しており、画像上の明示的な属性ローカライズ機構を欠いている。
本研究では,ZSLの問題設定における注意に基づくモデルを提案し,未知のクラス認識に有用な属性を学習する。
本手法では,視覚変換器に適応したアテンション機構を用いて,画像の小さなパッチ分割による識別特性の取得と学習を行う。
3つの人気のあるzslベンチマーク(すなわち、awa2、cub、sun)で実験を行い、提案手法の有効性を示す3つのデータセットすべてにおいて、最先端の調和平均結果を新たに設定した。
関連論文リスト
- Zero-Shot Learning by Harnessing Adversarial Samples [52.09717785644816]
本稿では,HAS(Harnessing Adversarial Samples)によるZSL(Zero-Shot Learning)アプローチを提案する。
HASは3つの重要な側面を考慮に入れた敵の訓練を通じてZSLを前進させる。
本稿では,ZSLと一般化ゼロショット学習(GZSL)の両シナリオにおいて,敵対的サンプルアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-08-01T06:19:13Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - DUET: Cross-modal Semantic Grounding for Contrastive Zero-shot Learning [37.48292304239107]
本稿では, DUET という変換器を用いたエンドツーエンドZSL手法を提案する。
画像からセマンティック属性を分離するモデルの能力を調べるために,モーダルなセマンティックグラウンドネットワークを開発した。
DUETは、しばしば最先端のパフォーマンスを達成することができ、そのコンポーネントは有効であり、予測は解釈可能である。
論文 参考訳(メタデータ) (2022-07-04T11:12:12Z) - UniVIP: A Unified Framework for Self-Supervised Visual Pre-training [50.87603616476038]
単一中心オブジェクトまたは非調和データセット上で,汎用的な視覚表現を学習するための,新しい自己教師型フレームワークを提案する。
大規模実験により、非高調波COCOで事前訓練されたUniVIPは、最先端の転送性能を実現することが示された。
また、ImageNetのような単一中心オブジェクトのデータセットを利用でき、線形探索において同じ事前学習エポックでBYOLを2.5%上回る。
論文 参考訳(メタデータ) (2022-03-14T10:04:04Z) - Implicit and Explicit Attention for Zero-Shot Learning [11.66422653137002]
ゼロショット学習(ZSL)モデルにおけるバイアス問題に対処するための暗黙的かつ明示的な注意機構を提案する。
我々は、AWA2、CUB、SUNの3つの人気のあるベンチマークで包括的な実験を行う。
論文 参考訳(メタデータ) (2021-10-02T18:06:21Z) - Attribute-Modulated Generative Meta Learning for Zero-Shot
Classification [52.64680991682722]
ゼロショット学習のためのAttribute-Modulated GenerAtive Meta-modelを提案する。
本モデルは属性対応変調ネットワークと属性対応生成ネットワークから構成される。
実験により,AMAZはZSLで3.8%,ZSLで5.1%改善し,ZSL設定を一般化した。
論文 参考訳(メタデータ) (2021-04-22T04:16:43Z) - Goal-Oriented Gaze Estimation for Zero-Shot Learning [62.52340838817908]
識別的属性の局在性を改善するために, 目標指向視線推定モジュール(GEM)を提案する。
属性記述に導かれた新しい物体を認識する視覚注意領域を得るために,実際の人間の視線位置を予測することを目的とする。
この研究は、高レベルのコンピュータビジョンタスクに人間の視線データセットと自動視線推定アルゴリズムを集めることの有望な利点を示しています。
論文 参考訳(メタデータ) (2021-03-05T02:14:57Z) - Adversarial Self-Supervised Learning for Semi-Supervised 3D Action
Recognition [123.62183172631443]
本稿では,SSLと半教師付きスキームを緊密に結合する新しいフレームワークであるAdversarial Self-Supervised Learning (ASSL)を紹介する。
具体的には,3次元動作認識のための学習表現の識別能力を向上させる効果的なSSL方式を設計する。
論文 参考訳(メタデータ) (2020-07-12T08:01:06Z) - A Biologically Inspired Feature Enhancement Framework for Zero-Shot
Learning [18.348568695197553]
本稿では,ゼロショット学習(ZSL)アルゴリズムのための生物学的にインスパイアされた機能拡張フレームワークを提案する。
具体的には、補助データセットを用いてZSLモデルの特徴抽出器を強化する2チャンネル学習フレームワークを設計する。
提案手法は,ZSLモデルの有効性を効果的に向上し,3つのベンチマークZSLタスクの最先端結果が得られる。
論文 参考訳(メタデータ) (2020-05-13T13:25:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。