論文の概要: A Simple Approach for Zero-Shot Learning based on Triplet Distribution
Embeddings
- arxiv url: http://arxiv.org/abs/2103.15939v1
- Date: Mon, 29 Mar 2021 20:26:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-01 06:57:18.914078
- Title: A Simple Approach for Zero-Shot Learning based on Triplet Distribution
Embeddings
- Title(参考訳): 三重項分布埋め込みに基づくゼロショット学習の簡易化
- Authors: Vivek Chalumuri, Bac Nguyen
- Abstract要約: ZSLは、セマンティック情報を利用して、ラベル付きトレーニングデータを使わずに、目に見えないクラスを認識することを目指している。
既存のZSL法は主にベクトルを用いて意味空間への埋め込みを表現する。
分散埋め込みの利用を利用してこの問題に対処する。
- 参考スコア(独自算出の注目度): 6.193231258199234
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given the semantic descriptions of classes, Zero-Shot Learning (ZSL) aims to
recognize unseen classes without labeled training data by exploiting semantic
information, which contains knowledge between seen and unseen classes. Existing
ZSL methods mainly use vectors to represent the embeddings to the semantic
space. Despite the popularity, such vector representation limits the
expressivity in terms of modeling the intra-class variability for each class.
We address this issue by leveraging the use of distribution embeddings. More
specifically, both image embeddings and class embeddings are modeled as
Gaussian distributions, where their similarity relationships are preserved
through the use of triplet constraints. The key intuition which guides our
approach is that for each image, the embedding of the correct class label
should be closer than that of any other class label. Extensive experiments on
multiple benchmark data sets show that the proposed method achieves highly
competitive results for both traditional ZSL and more challenging Generalized
Zero-Shot Learning (GZSL) settings.
- Abstract(参考訳): Zero-Shot Learning (ZSL) は、クラスの意味的記述を考慮し、目に見えるクラスと目見えないクラスの間の知識を含む意味情報を活用することによって、ラベル付けされたトレーニングデータなしで、目に見えないクラスを認識することを目的としている。
既存のZSL法は主にベクトルを用いて意味空間への埋め込みを表現する。
人気にもかかわらず、そのようなベクトル表現はクラスごとのクラス内変数のモデリングにおいて表現性を制限する。
分散埋め込みの利用を利用してこの問題に対処する。
具体的には、画像埋め込みとクラス埋め込みの両方をガウス分布としてモデル化し、その類似性関係は三重項制約を用いて保存される。
私たちのアプローチを導く重要な直感は、各イメージに対して、正しいクラスラベルの埋め込みは他のどのクラスラベルよりも近いべきであるということです。
複数のベンチマークデータセットに対する大規模な実験により、提案手法は従来のZSLとより困難な汎用ゼロショット学習(GZSL)設定の両方に対して高い競争力を発揮することが示された。
関連論文リスト
- Towards Realistic Zero-Shot Classification via Self Structural Semantic
Alignment [53.2701026843921]
大規模事前訓練型視覚言語モデル(VLM)はゼロショット分類に有効であることが証明されている。
本稿では,アノテーションではなく,より広い語彙を前提とした,より難易度の高いゼロショット分類(Realistic Zero-Shot Classification)を提案する。
本稿では,ラベルのないデータから構造意味情報を抽出し,同時に自己学習を行う自己構造意味アライメント(S3A)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-24T17:56:46Z) - Zero-Shot Learning by Harnessing Adversarial Samples [52.09717785644816]
本稿では,HAS(Harnessing Adversarial Samples)によるZSL(Zero-Shot Learning)アプローチを提案する。
HASは3つの重要な側面を考慮に入れた敵の訓練を通じてZSLを前進させる。
本稿では,ZSLと一般化ゼロショット学習(GZSL)の両シナリオにおいて,敵対的サンプルアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-08-01T06:19:13Z) - Bi-directional Distribution Alignment for Transductive Zero-Shot
Learning [48.80413182126543]
そこで我々は,Bi-VAEGANと呼ばれる新しいゼロショット学習モデル(TZSL)を提案する。
視覚空間と補助空間の間の配向の強化によるシフトを大幅に改善する。
ベンチマーク評価では、Bi-VAEGANは、標準および一般化されたTZSL設定の両方の下で、新しい芸術の状態を達成している。
論文 参考訳(メタデータ) (2023-03-15T15:32:59Z) - DUET: Cross-modal Semantic Grounding for Contrastive Zero-shot Learning [37.48292304239107]
本稿では, DUET という変換器を用いたエンドツーエンドZSL手法を提案する。
画像からセマンティック属性を分離するモデルの能力を調べるために,モーダルなセマンティックグラウンドネットワークを開発した。
DUETは、しばしば最先端のパフォーマンスを達成することができ、そのコンポーネントは有効であり、予測は解釈可能である。
論文 参考訳(メタデータ) (2022-07-04T11:12:12Z) - Cluster-based Contrastive Disentangling for Generalized Zero-Shot
Learning [25.92340532509084]
Generalized Zero-Shot Learning (GZSL) は、目に見えないクラスと見えないクラスの両方を認識することを目的としている。
本稿では,クラスタベースのContrastive Disentangling(CCD)手法を提案する。
論文 参考訳(メタデータ) (2022-03-05T02:50:12Z) - Discriminative Region-based Multi-Label Zero-Shot Learning [145.0952336375342]
マルチラベルゼロショット学習(Multi-label zero-shot Learning、ZSL)は、標準のシングルラベルZSLのより現実的な対位法である。
本稿では,地域別識別可能性保存型ZSLに対する代替アプローチを提案する。
論文 参考訳(メタデータ) (2021-08-20T17:56:47Z) - Isometric Propagation Network for Generalized Zero-shot Learning [72.02404519815663]
一般的な戦略は、クラス属性の意味空間と、見たクラスとそのデータに基づいて画像の視覚空間とのマッピングを学ぶことである。
本稿では,各空間内のクラス間の関係を強化し,2つの空間におけるクラス依存性を整合させるIsometric propagation Network (IPN)を提案する。
IPNは3つの人気のあるゼロショット学習ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-02-03T12:45:38Z) - Information Bottleneck Constrained Latent Bidirectional Embedding for
Zero-Shot Learning [59.58381904522967]
本稿では,密な視覚-意味的結合制約を持つ埋め込み型生成モデルを提案する。
視覚空間と意味空間の両方の埋め込みパラメトリック分布を校正する統合潜在空間を学習する。
本手法は, 画像のラベルを生成することにより, トランスダクティブZSL設定に容易に拡張できる。
論文 参考訳(メタデータ) (2020-09-16T03:54:12Z) - Zero-Shot Recognition through Image-Guided Semantic Classification [9.291055558504588]
ゼロショット学習(ZSL)のための新しい埋め込み型フレームワークを提案する。
複数ラベル分類のための2値関係法により,画像と意味分類器のマッピングを逆学習する手法を提案する。
IGSCは概念的には単純であり、分類のための既存のディープアーキテクチャをわずかに拡張することで実現可能である。
論文 参考訳(メタデータ) (2020-07-23T06:22:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。