論文の概要: Zero-Shot Recognition through Image-Guided Semantic Classification
- arxiv url: http://arxiv.org/abs/2007.11814v1
- Date: Thu, 23 Jul 2020 06:22:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 12:41:18.639897
- Title: Zero-Shot Recognition through Image-Guided Semantic Classification
- Title(参考訳): 画像誘導セマンティック分類によるゼロショット認識
- Authors: Mei-Chen Yeh and Fang Li
- Abstract要約: ゼロショット学習(ZSL)のための新しい埋め込み型フレームワークを提案する。
複数ラベル分類のための2値関係法により,画像と意味分類器のマッピングを逆学習する手法を提案する。
IGSCは概念的には単純であり、分類のための既存のディープアーキテクチャをわずかに拡張することで実現可能である。
- 参考スコア(独自算出の注目度): 9.291055558504588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new embedding-based framework for zero-shot learning (ZSL). Most
embedding-based methods aim to learn the correspondence between an image
classifier (visual representation) and its class prototype (semantic
representation) for each class. Motivated by the binary relevance method for
multi-label classification, we propose to inversely learn the mapping between
an image and a semantic classifier. Given an input image, the proposed
Image-Guided Semantic Classification (IGSC) method creates a label classifier,
being applied to all label embeddings to determine whether a label belongs to
the input image. Therefore, semantic classifiers are image-adaptive and are
generated during inference. IGSC is conceptually simple and can be realized by
a slight enhancement of an existing deep architecture for classification; yet
it is effective and outperforms state-of-the-art embedding-based generalized
ZSL approaches on standard benchmarks.
- Abstract(参考訳): ゼロショット学習(ZSL)のための新しい埋め込み型フレームワークを提案する。
組込みベースのほとんどの手法は、画像分類器(視覚表現)とそのクラスプロトタイプ(意味表現)の対応性を学ぶことを目的としている。
複数ラベル分類のための2値関係法により,画像と意味分類器のマッピングを逆学習する手法を提案する。
入力画像が与えられた場合、igsc(image-guided semantic classification)メソッドはラベル分類器を作成し、ラベルが入力画像に属するかどうかを判断するためにすべてのラベル埋め込みに適用する。
したがって、セマンティック分類器は画像適応型であり、推論中に生成される。
IGSCは概念的には単純であり、分類のために既存のディープアーキテクチャをわずかに拡張することで実現可能であるが、標準ベンチマーク上での最先端の埋め込みベースの一般化ZSLアプローチよりも効果的で優れている。
関連論文リスト
- CDUL: CLIP-Driven Unsupervised Learning for Multi-Label Image
Classification [23.392746466420128]
アノテーションのないマルチラベル画像分類のためのCLIPに基づく教師なし学習手法を提案する。
我々は、強力なCLIPモデルを完全に活用し、グローバルローカルな画像-テキスト類似性アグリゲーションに基づくマルチラベル予測のためのCLIPの拡張手法を提案する。
提案手法は,MS-COCO,PASCAL VOC 2007,PASCAL VOC 2012,NASデータセット上で,最先端の教師なし手法より優れている。
論文 参考訳(メタデータ) (2023-07-31T13:12:02Z) - Semantic-Aware Dual Contrastive Learning for Multi-label Image
Classification [8.387933969327852]
本稿では,サンプル対サンプルのコントラスト学習を取り入れた,セマンティック・アウェアな2つのコントラスト学習フレームワークを提案する。
具体的には、セマンティック・アウェアな表現学習を活用して、カテゴリに関連する局所的識別特徴を抽出する。
提案手法は, 最先端の手法よりも有効であり, 性能も優れている。
論文 参考訳(メタデータ) (2023-07-19T01:57:31Z) - Language-driven Semantic Segmentation [88.21498323896475]
本稿では,言語駆動型セマンティックイメージセグメンテーションの新しいモデルLSegを提案する。
テキストエンコーダを用いて記述型入力ラベルの埋め込みを計算する。
エンコーダは、画素埋め込みを対応するセマンティッククラスのテキスト埋め込みに合わせるために、対照的な目的で訓練される。
論文 参考訳(メタデータ) (2022-01-10T18:59:10Z) - A Simple Approach for Zero-Shot Learning based on Triplet Distribution
Embeddings [6.193231258199234]
ZSLは、セマンティック情報を利用して、ラベル付きトレーニングデータを使わずに、目に見えないクラスを認識することを目指している。
既存のZSL法は主にベクトルを用いて意味空間への埋め込みを表現する。
分散埋め込みの利用を利用してこの問題に対処する。
論文 参考訳(メタデータ) (2021-03-29T20:26:20Z) - Seed the Views: Hierarchical Semantic Alignment for Contrastive
Representation Learning [116.91819311885166]
一つの画像から生成されたビューをtextbfCross-samples や Multi-level representation に拡張することで,階層的なセマンティックアライメント戦略を提案する。
提案手法はCsMlと呼ばれ,サンプル間の多層視覚表現を堅牢な方法で統合する機能を備えている。
論文 参考訳(メタデータ) (2020-12-04T17:26:24Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Causal Intervention for Weakly-Supervised Semantic Segmentation [122.1846968696862]
画像レベルのラベルのみを用いて、より優れたピクセルレベルの擬似マスクを生成することを目指している。
画像,コンテキスト,およびクラスラベル間の因果関係を分析するための構造因果モデルを提案する。
そこで本研究では,画像レベルの分類において,矛盾するバイアスを取り除くためのコンテキスト調整(CONTA)手法を提案する。
論文 参考訳(メタデータ) (2020-09-26T09:26:29Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Learning Representations For Images With Hierarchical Labels [1.3579420996461438]
クラスラベルによって誘導されるセマンティック階層に関する情報を活用するための一連の手法を提案する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の提供により、全体的な性能が向上することを示す。
しかし,CNN分類器には階層的な情報が注入され,組込みベースモデルでは,新たに提示された実世界ETHエコロジーコレクションイメージデータセットの階層非依存モデルよりも優れていた。
論文 参考訳(メタデータ) (2020-04-02T09:56:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。