Fugu-MT 論文翻訳(概要): Generative Multi-Label Zero-Shot Learning

論文の概要: Generative Multi-Label Zero-Shot Learning

arxiv url: http://arxiv.org/abs/2101.11606v2
Date: Thu, 28 Jan 2021 16:14:42 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-01 19:31:11.127685
Title: Generative Multi-Label Zero-Shot Learning
Title（参考訳）: 生成型マルチラベルゼロショット学習
Authors: Akshita Gupta, Sanath Narayan, Salman Khan, Fahad Shahbaz Khan, Ling Shao, Joost van de Weijer
Abstract要約: マルチラベルゼロショット学習は、トレーニング中にデータが入手できない複数の見えないカテゴリにイメージを分類する試みである。我々の研究は、(一般化された)ゼロショット設定におけるマルチラベル機能の問題に最初に取り組みました。私たちのクロスレベル核融合に基づく生成アプローチは、3つのデータセットすべてにおいて最先端の手法よりも優れています。
参考スコア（独自算出の注目度）: 126.04772769084639
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Multi-label zero-shot learning strives to classify images into multiple unseen categories for which no data is available during training. The test samples can additionally contain seen categories in the generalized variant. Existing approaches rely on learning either shared or label-specific attention from the seen classes. Nevertheless, computing reliable attention maps for unseen classes during inference in a multi-label setting is still a challenge. In contrast, state-of-the-art single-label generative adversarial network (GAN) based approaches learn to directly synthesize the class-specific visual features from the corresponding class attribute embeddings. However, synthesizing multi-label features from GANs is still unexplored in the context of zero-shot setting. In this work, we introduce different fusion approaches at the attribute-level, feature-level and cross-level (across attribute and feature-levels) for synthesizing multi-label features from their corresponding multi-label class embedding. To the best of our knowledge, our work is the first to tackle the problem of multi-label feature synthesis in the (generalized) zero-shot setting. Comprehensive experiments are performed on three zero-shot image classification benchmarks: NUS-WIDE, Open Images and MS COCO. Our cross-level fusion-based generative approach outperforms the state-of-the-art on all three datasets. Furthermore, we show the generalization capabilities of our fusion approach in the zero-shot detection task on MS COCO, achieving favorable performance against existing methods. The source code is available at https://github.com/akshitac8/Generative_MLZSL.
Abstract（参考訳）: マルチラベルゼロショット学習は、トレーニング中にデータが入手できない複数の見えないカテゴリにイメージを分類する試みである。テストサンプルは、一般化変種に見られるカテゴリも追加で含めることができる。既存のアプローチは、見たクラスから共有またはラベル固有の注意を学習することに依存します。それでも、マルチラベル設定での推論中に見つからないクラスに対する信頼性の高い注意マップの計算は依然として課題である。対照的に、最先端の単一ラベル生成敵対ネットワーク(GAN)ベースのアプローチは、対応するクラス属性埋め込みからクラス固有の視覚機能を直接合成することを学びます。しかし、gansからマルチラベル機能を合成することは、ゼロショット設定の文脈ではまだ未検討である。本稿では,属性レベル,機能レベル,クロスレベル(across属性と機能レベル)で異なる融合アプローチを導入し,対応するマルチラベルクラス埋め込みからマルチラベル機能を合成する。私たちの知識を最大限に活かすために、私たちの仕事は(一般化された)ゼロショット設定におけるマルチラベル機能合成の問題に取り組む最初のものです。 NUS-WIDE、Open Images、MS COCOの3つのゼロショット画像分類ベンチマークで包括的な実験を行います。当社のクロスレベル融合ベースのジェネレーティブアプローチは、すべての3つのデータセットの最先端を上回ります。さらに、MS COCOのゼロショット検出タスクにおけるフュージョンアプローチの一般化能力を示し、既存の手法に対して良好な性能を発揮します。ソースコードはhttps://github.com/akshitac8/Generative_MLZSLで入手できる。

関連論文リスト

Class-Independent Increment: An Efficient Approach for Multi-label Class-Incremental Learning [49.65841002338575]
本稿では,MLCIL(Multi-label class-incremental Learning)問題に焦点をあてる。マルチラベルサンプルに対して複数のクラスレベルの埋め込みを抽出する新しいクラス独立インクリメンタルネットワーク(CINet)を提案する。クラス固有のトークンを構築することで、異なるクラスの知識を学び、保存する。
論文参考訳（メタデータ） (2025-03-01T14:40:52Z)
TagCLIP: A Local-to-Global Framework to Enhance Open-Vocabulary Multi-Label Classification of CLIP Without Training [29.431698321195814]
Contrastive Language-Image Pre-Training (CLIP) はオープン語彙分類において顕著な能力を示した。 CLIPは、グローバル機能が最も顕著なクラスに支配される傾向があるため、マルチラベルデータセットのパフォーマンスが低い。画像タグを得るための局所言語フレームワークを提案する。
論文参考訳（メタデータ） (2023-12-20T08:15:40Z)
Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2023-10-30T00:32:47Z)
Learning Disentangled Label Representations for Multi-label Classification [39.97251974500034]
One-Shared-Feature-for-Multiple-Labels (OFML) は識別ラベルの特徴を学習するのに役立ちません。我々は,One-specific-Feature-for-One-Label(OFOL)機構を導入し,新しいアンタングル付きラベル特徴学習フレームワークを提案する。 8つのデータセットで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2022-12-02T21:49:34Z)
Discriminative Region-based Multi-Label Zero-Shot Learning [145.0952336375342]
マルチラベルゼロショット学習(Multi-label zero-shot Learning、ZSL)は、標準のシングルラベルZSLのより現実的な対位法である。本稿では,地域別識別可能性保存型ZSLに対する代替アプローチを提案する。
論文参考訳（メタデータ） (2021-08-20T17:56:47Z)
Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文参考訳（メタデータ） (2021-07-07T11:43:59Z)
CLASTER: Clustering with Reinforcement Learning for Zero-Shot Action Recognition [52.66360172784038]
各インスタンスを個別に最適化するのではなく,すべてのトレーニングサンプルを同時に考慮したクラスタリングモデルを提案する。提案手法をCLASTERと呼び,すべての標準データセットの最先端性を常に改善することを確認する。
論文参考訳（メタデータ） (2021-01-18T12:46:24Z)
Multi-label Few/Zero-shot Learning with Knowledge Aggregated from Multiple Label Graphs [8.44680447457879]
本稿では,異なる意味的ラベル関係をコードする複数のラベルグラフから知識を融合する,シンプルな多グラフ集約モデルを提案する。本研究は,多グラフ知識集約を用いた手法が,少数・ゼロショットラベルのほとんどすべてにおいて,大幅な性能向上を実現していることを示す。
論文参考訳（メタデータ） (2020-10-15T01:15:43Z)
Knowledge-Guided Multi-Label Few-Shot Learning for General Image Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文参考訳（メタデータ） (2020-09-20T15:05:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。