論文の概要: A Multi-class Approach -- Building a Visual Classifier based on Textual
Descriptions using Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2011.09236v1
- Date: Wed, 18 Nov 2020 12:06:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 03:19:25.626382
- Title: A Multi-class Approach -- Building a Visual Classifier based on Textual
Descriptions using Zero-Shot Learning
- Title(参考訳): マルチクラスアプローチ-ゼロショット学習を用いたテキスト記述に基づく視覚分類器の構築
- Authors: Preeti Jagdish Sajjan and Frank G. Glavin
- Abstract要約: 機械学習の主なハードル、すなわちデータの不足と分類モデルの制約付き予測を克服する。
特定のクラスに対して学習するのではなく、ラベル付き画像をテキスト記述にマッピングすることで分類器を訓練する。
- 参考スコア(独自算出の注目度): 0.34265828682659694
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine Learning (ML) techniques for image classification routinely require
many labelled images for training the model and while testing, we ought to use
images belonging to the same domain as those used for training. In this paper,
we overcome the two main hurdles of ML, i.e. scarcity of data and constrained
prediction of the classification model. We do this by introducing a visual
classifier which uses a concept of transfer learning, namely Zero-Shot Learning
(ZSL), and standard Natural Language Processing techniques. We train a
classifier by mapping labelled images to their textual description instead of
training it for specific classes. Transfer learning involves transferring
knowledge across domains that are similar. ZSL intelligently applies the
knowledge learned while training for future recognition tasks. ZSL
differentiates classes as two types: seen and unseen classes. Seen classes are
the classes upon which we have trained our model and unseen classes are the
classes upon which we test our model. The examples from unseen classes have not
been encountered in the training phase. Earlier research in this domain focused
on developing a binary classifier but, in this paper, we present a multi-class
classifier with a Zero-Shot Learning approach.
- Abstract(参考訳): 画像分類のための機械学習(ML)技術は、通常、モデルをトレーニングするためにラベル付きイメージを多く必要としており、テスト中は、トレーニングに使用するものと同じドメインに属するイメージを使用する必要がある。
本稿では,データ不足と分類モデルの制約付き予測という,MLの主な2つのハードルを克服する。
そこで我々は,ゼロショット学習(zsl)と標準自然言語処理という,トランスファー学習の概念を用いた視覚分類器を導入する。
特定のクラスに対して学習するのではなく、ラベル付き画像をテキスト記述にマッピングすることで分類器を訓練する。
転校学習は、類似する領域にまたがる知識の伝達を伴う。
ZSLは、将来の認識タスクのトレーニング中に学んだ知識を知的に適用する。
ZSLはクラスを2つのタイプとして区別する。
senクラスはモデルを訓練したクラスであり、unseenクラスはモデルをテストしたクラスです。
未確認クラスからの例は、トレーニング段階では出ていない。
この領域における初期の研究はバイナリ分類器の開発に重点を置いていたが、本稿ではゼロショット学習アプローチを用いた多クラス分類器を提案する。
関連論文リスト
- Premonition: Using Generative Models to Preempt Future Data Changes in
Continual Learning [63.850451635362425]
継続的な学習には、データ分散の継続的な変化に対応するためのモデルが必要である。
本稿では,大規模言語モデルと画像生成モデルの組み合わせが有用であることを示す。
トレーニング済みネットワークのバックボーンは、下流の連続学習問題に有用な表現を学習できることがわかった。
論文 参考訳(メタデータ) (2024-03-12T06:29:54Z) - Deep Semantic-Visual Alignment for Zero-Shot Remote Sensing Image Scene
Classification [26.340737217001497]
ゼロショット学習(ZSL)は、トレーニング中に見えない新しいクラスを識別する。
以前のZSLモデルは、主に言語モデルから抽出された手作業でラベル付けされた属性や単語の埋め込みに依存し、見受けられるクラスから新しいクラスに知識を伝達する。
本稿では,視覚的に検出可能な属性を自動的に収集することを提案する。属性と画像のセマンティック・視覚的類似性を記述することで,クラスごとの属性を予測する。
論文 参考訳(メタデータ) (2024-02-03T09:18:49Z) - Image-free Classifier Injection for Zero-Shot Classification [72.66409483088995]
ゼロショット学習モデルは、訓練中に見られなかったクラスからのサンプルのイメージ分類において顕著な結果が得られる。
我々は,画像データを用いることなく,ゼロショット分類機能を備えた事前学習モデルの装備を目指す。
提案したイメージフリーインジェクション・ウィズ・セマンティックス (ICIS) でこれを実現する。
論文 参考訳(メタデータ) (2023-08-21T09:56:48Z) - DiRaC-I: Identifying Diverse and Rare Training Classes for Zero-Shot
Learning [6.75714270653184]
ゼロショット学習(ZSL)のためのデータセットから、インテリジェントにトレーニングクラスを選択することで、既存のZSLメソッドのパフォーマンスを向上させることは直感的である。
属性ベースのデータセットが与えられた場合、ZSLモデルのトレーニングに最も適した「Seen Class」をインテリジェントに生成できるDiverse and Rare Class Identifier (DiRaC-I) というフレームワークを提案する。
DRaC-IはZSLモデルの分類精度の向上に有効であることを示す。
論文 参考訳(メタデータ) (2022-12-31T16:05:09Z) - Learning Semantic Ambiguities for Zero-Shot Learning [0.0]
本稿では,任意の条件生成型ZSL法に適用可能な正規化手法を提案する。
トレーニング時に利用できない意味記述が可能な差別的特徴を合成することを学ぶ。
この手法は、文献でよく用いられる4つのデータセット上で、ZSLとGZSLに対して評価される。
論文 参考訳(メタデータ) (2022-01-05T21:08:29Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - Aligning Visual Prototypes with BERT Embeddings for Few-Shot Learning [48.583388368897126]
ほとんどショット学習は、これまで目に見えないイメージのカテゴリを認識するための学習である。
画像クラスの名称を考慮に入れた手法を提案する。
論文 参考訳(メタデータ) (2021-05-21T08:08:28Z) - OntoZSL: Ontology-enhanced Zero-shot Learning [19.87808305218359]
Zero-shot Learning(ZSL)の実装の鍵は、クラス間の意味的な関係を構築するクラスの以前の知識を活用することです。
本稿では,zslのクラス間関係をモデル化するために,より豊かで競争力の高い事前知識を探索する。
目に見えないクラス間のデータ不均衡に対処するため,GAN(Generative Adversarial Networks)を用いた生成型ZSLフレームワークを開発した。
論文 参考訳(メタデータ) (2021-02-15T04:39:58Z) - Isometric Propagation Network for Generalized Zero-shot Learning [72.02404519815663]
一般的な戦略は、クラス属性の意味空間と、見たクラスとそのデータに基づいて画像の視覚空間とのマッピングを学ぶことである。
本稿では,各空間内のクラス間の関係を強化し,2つの空間におけるクラス依存性を整合させるIsometric propagation Network (IPN)を提案する。
IPNは3つの人気のあるゼロショット学習ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-02-03T12:45:38Z) - Attribute Propagation Network for Graph Zero-shot Learning [57.68486382473194]
属性伝達ネットワーク (APNet) を導入し, 1) クラス毎に属性ベクトルを生成するグラフ伝搬モデルと, 2) パラメータ化隣人 (NN) 分類器から構成する。
APNetは、2つのゼロショット学習設定と5つのベンチマークデータセットによる実験で、魅力的なパフォーマンスまたは新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-24T16:53:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。