論文の概要: Multi-label Zero-shot Classification by Learning to Transfer from
External Knowledge
- arxiv url: http://arxiv.org/abs/2007.15610v2
- Date: Fri, 31 Jul 2020 01:29:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 14:24:31.912586
- Title: Multi-label Zero-shot Classification by Learning to Transfer from
External Knowledge
- Title(参考訳): 外部知識からの学習による多ラベルゼロショット分類
- Authors: He Huang, Yuanwei Chen, Wei Tang, Wenhao Zheng, Qing-Guo Chen, Yao Hu,
Philip Yu
- Abstract要約: マルチラベルゼロショット分類は、入力画像に対する複数の未知のクラスラベルを予測することを目的としている。
本稿では,外部知識の伝達を学習することで,新たなゼロショット分類フレームワークを提案する。
- 参考スコア(独自算出の注目度): 36.04579549557464
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-label zero-shot classification aims to predict multiple unseen class
labels for an input image. It is more challenging than its single-label
counterpart. On one hand, the unconstrained number of labels assigned to each
image makes the model more easily overfit to those seen classes. On the other
hand, there is a large semantic gap between seen and unseen classes in the
existing multi-label classification datasets. To address these difficult
issues, this paper introduces a novel multi-label zero-shot classification
framework by learning to transfer from external knowledge. We observe that
ImageNet is commonly used to pretrain the feature extractor and has a large and
fine-grained label space. This motivates us to exploit it as external knowledge
to bridge the seen and unseen classes and promote generalization. Specifically,
we construct a knowledge graph including not only classes from the target
dataset but also those from ImageNet. Since ImageNet labels are not available
in the target dataset, we propose a novel PosVAE module to infer their initial
states in the extended knowledge graph. Then we design a relational graph
convolutional network (RGCN) to propagate information among classes and achieve
knowledge transfer. Experimental results on two benchmark datasets demonstrate
the effectiveness of the proposed approach.
- Abstract(参考訳): マルチラベルゼロショット分類は、入力画像に対する複数の未知のクラスラベルを予測することを目的としている。
シングルレーベルよりも難しい。
一方、各イメージに割り当てられたラベルの制限されていない数は、モデルが見たクラスにもっと簡単にオーバーフィットする。
一方、既存のマルチラベル分類データセットでは、目に見えるクラスと見えないクラスの間に大きな意味的ギャップがある。
このような難題に対処するために,外部知識からの伝達を学習する多ラベルゼロショット分類フレームワークを提案する。
ImageNetは特徴抽出器の事前訓練によく使われており、大きめできめ細かなラベル空間を持つ。
これにより、目に見えるクラスと見えないクラスを橋渡しし、一般化を促進する外部知識として活用するモチベーションが生まれます。
具体的には、ターゲットデータセットのクラスだけでなく、ImageNetのクラスも含む知識グラフを構築する。
対象とするデータセットではimagenetラベルが利用できないため,拡張知識グラフで初期状態を推測する新しいposvaeモジュールを提案する。
次に,関係グラフ畳み込みネットワーク(RGCN)を設計し,クラス間で情報を伝達し,知識伝達を実現する。
2つのベンチマークデータセットの実験結果から,提案手法の有効性が示された。
関連論文リスト
- Vision-Language Pseudo-Labels for Single-Positive Multi-Label Learning [11.489541220229798]
一般的なマルチラベル学習では、モデルは単一の入力画像に対して複数のラベルやカテゴリを予測することを学習する。
これは、タスクがイメージの多くの可能なラベルから単一のラベルを予測している、標準的なマルチクラスイメージ分類とは対照的である。
論文 参考訳(メタデータ) (2023-10-24T16:36:51Z) - KMF: Knowledge-Aware Multi-Faceted Representation Learning for Zero-Shot
Node Classification [75.95647590619929]
Zero-Shot Node Classification (ZNC)は、グラフデータ分析において、新しく重要なタスクである。
ラベルセマンティクスの豊かさを向上する知識認識型多面的フレームワーク(KMF)を提案する。
ノード情報集約によるプロトタイプドリフトの問題を軽減するために,新しい幾何学的制約を開発した。
論文 参考訳(メタデータ) (2023-08-15T02:38:08Z) - Few-shot Class-Incremental Semantic Segmentation via Pseudo-Labeling and
Knowledge Distillation [3.4436201325139737]
セマンティックセグメンテーションモデルのための新しいクラスをいくつかの例から学習する問題に対処する。
限られたデータから学習するために、数発のトレーニングアノテーションを増強する擬似ラベル方式を提案する。
上記のステップを、統一的な学習目標を持つ単一の畳み込みニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2023-08-05T05:05:37Z) - Multi-label Iterated Learning for Image Classification with Label
Ambiguity [3.5736176624479654]
単一ラベルからの多ラベル学習の帰納バイアスを組み込むために,多ラベル反復学習(MILe)を提案する。
MILeは、バイナリ予測を伝搬することにより、画像のマルチラベル記述を構築する、シンプルだが効果的な手順である。
我々は,MILeがラベルノイズを効果的に低減し,WebVisionのような実世界の大規模ノイズデータに対して最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2021-11-23T22:10:00Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Adversarial Learning for Personalized Tag Recommendation [61.76193196463919]
大規模データセットでトレーニング可能なエンドツーエンドのディープネットワークを提案する。
ユーザの嗜好と視覚的エンコーディングの合同トレーニングにより、ネットワークは視覚的嗜好をタグ付け行動と効率的に統合することができる。
本稿では,提案モデルの有効性を2つの大規模および公開データセットで示す。
論文 参考訳(メタデータ) (2020-04-01T20:41:41Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z) - Continual Local Replacement for Few-shot Learning [13.956960291580938]
少数ショット学習の目標は,1つないし少数のトレーニングデータに基づいて,新しいクラスを認識可能なモデルを学習することにある。
1)新しいクラスの優れた特徴表現が欠けていること、(2)ラベル付きデータの一部が真のデータ分布を正確に表現できないこと、である。
データ不足問題に対処するために,新たな局所的置換戦略を提案する。
論文 参考訳(メタデータ) (2020-01-23T04:26:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。