論文の概要: Semantic Diversity Learning for Zero-Shot Multi-label Classification
- arxiv url: http://arxiv.org/abs/2105.05926v1
- Date: Wed, 12 May 2021 19:39:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 02:18:19.210797
- Title: Semantic Diversity Learning for Zero-Shot Multi-label Classification
- Title(参考訳): ゼロショットマルチラベル分類のための意味的多様性学習
- Authors: Avi Ben-Cohen, Nadav Zamir, Emanuel Ben Baruch, Itamar Friedman, Lihi
Zelnik-Manor
- Abstract要約: 本研究では,マルチラベルゼロショット学習のためのエンドツーエンドモデルトレーニングを提案する。
本研究では,主埋め込みベクトルを持つ埋め込み行列を用いて,調整された損失関数を用いて訓練する。
さらに, 学習中, 組込み行列の多様性を促進するために, 高い意味的多様性を示す損失関数画像サンプルの重み付けを提案する。
- 参考スコア(独自算出の注目度): 14.480713752871523
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training a neural network model for recognizing multiple labels associated
with an image, including identifying unseen labels, is challenging, especially
for images that portray numerous semantically diverse labels. As challenging as
this task is, it is an essential task to tackle since it represents many
real-world cases, such as image retrieval of natural images. We argue that
using a single embedding vector to represent an image, as commonly practiced,
is not sufficient to rank both relevant seen and unseen labels accurately. This
study introduces an end-to-end model training for multi-label zero-shot
learning that supports semantic diversity of the images and labels. We propose
to use an embedding matrix having principal embedding vectors trained using a
tailored loss function. In addition, during training, we suggest up-weighting
in the loss function image samples presenting higher semantic diversity to
encourage the diversity of the embedding matrix. Extensive experiments show
that our proposed method improves the zero-shot model's quality in tag-based
image retrieval achieving SoTA results on several common datasets (NUS-Wide,
COCO, Open Images).
- Abstract(参考訳): 画像に関連付けられた複数のラベルを識別するためのニューラルネットワークモデルをトレーニングすることは、特に多くの意味的に多様なラベルを描写する画像において困難である。
この課題が困難であるように、自然画像の画像検索など、現実世界の多くのケースを表現するため、取り組むことが必須の課題である。
イメージを1つの埋め込みベクトルで表現することは、一般的に行われているように、関連性のあるラベルと未知のラベルの両方を正確にランク付けするのに十分ではない。
本研究では、画像とラベルの意味的多様性をサポートするマルチラベルゼロショット学習のためのエンドツーエンドモデルトレーニングを提案する。
そこで本研究では, 主埋め込みベクトルを持つ埋め込み行列を相補的損失関数を用いて学習する手法を提案する。
さらに, 学習中, 組込み行列の多様性を促進するために, 高い意味的多様性を示す損失関数画像サンプルの重み付けを提案する。
提案手法は,複数の共通データセット(NUS-Wide,COCO,Open Images)において,タグベース画像検索におけるゼロショットモデルの品質向上を示す。
関連論文リスト
- Towards Effective Multi-Label Recognition Attacks via Knowledge Graph
Consistency [33.250544869840155]
マルチラベル設定に対するマルチクラス攻撃の素早い拡張は,ラベル関係に違反することを示す。
本稿では,グラフに一貫性のあるマルチラベルアタックフレームワークを提案する。このフレームワークは,所望のターゲットセットの誤分類につながる小さな画像摂動を探索する。
論文 参考訳(メタデータ) (2022-07-11T19:08:32Z) - Dual-Perspective Semantic-Aware Representation Blending for Multi-Label
Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。
提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-26T00:33:44Z) - Multi-Label Image Classification with Contrastive Learning [57.47567461616912]
コントラスト学習の直接適用は,複数ラベルの場合においてほとんど改善できないことを示す。
完全教師付き環境下でのコントラスト学習を用いたマルチラベル分類のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-24T15:00:47Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - Multi-layered Semantic Representation Network for Multi-label Image
Classification [8.17894017454724]
マルチラベル画像分類(MLIC)は,複数の可能なラベルを画像に割り当てることを目的とした,基本的で実践的な課題である。
近年,多くのディープ畳み込みニューラルネットワーク(CNN)に基づく手法が提案され,ラベル相関がモデル化されている。
本稿では,ラベル相関のモデル化と意味表現の学習を改善することにより,この研究の方向性を推し進める。
論文 参考訳(メタデータ) (2021-06-22T08:04:22Z) - Multi-Label Learning from Single Positive Labels [37.17676289125165]
与えられた画像に対して適用可能なラベルを全て予測することは、マルチラベル分類(multi-label classification)として知られている。
その結果,ラベルの確認が著しく少ないにもかかわらず,完全ラベル付き分類器の性能にアプローチできることが示唆された。
論文 参考訳(メタデータ) (2021-06-17T17:58:04Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - SSKD: Self-Supervised Knowledge Distillation for Cross Domain Adaptive
Person Re-Identification [25.96221714337815]
ドメイン適応型人物再識別(re-ID)は、ソースドメインとターゲットドメインの間に大きな違いがあるため、難しい課題である。
既存の手法は主にクラスタリングアルゴリズムによって未ラベルのターゲット画像の擬似ラベルを生成する。
本稿では,識別学習とソフトラベル学習の2つのモジュールを含む自己監督的知識蒸留(SSKD)手法を提案する。
論文 参考訳(メタデータ) (2020-09-13T10:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。