論文の概要: Reconstruction Regularized Deep Metric Learning for Multi-label Image
Classification
- arxiv url: http://arxiv.org/abs/2007.13547v1
- Date: Mon, 27 Jul 2020 13:28:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 07:35:01.766521
- Title: Reconstruction Regularized Deep Metric Learning for Multi-label Image
Classification
- Title(参考訳): 複数ラベル画像分類のための正規化深度学習
- Authors: Changsheng Li and Chong Liu and Lixin Duan and Peng Gao and Kai Zheng
- Abstract要約: 本稿では,多ラベル画像分類問題に対処する新しい深度距離学習法を提案する。
私たちのモデルはエンドツーエンドでトレーニングできます。
- 参考スコア(独自算出の注目度): 39.055689258395624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a novel deep metric learning method to tackle the
multi-label image classification problem. In order to better learn the
correlations among images features, as well as labels, we attempt to explore a
latent space, where images and labels are embedded via two unique deep neural
networks, respectively. To capture the relationships between image features and
labels, we aim to learn a \emph{two-way} deep distance metric over the
embedding space from two different views, i.e., the distance between one image
and its labels is not only smaller than those distances between the image and
its labels' nearest neighbors, but also smaller than the distances between the
labels and other images corresponding to the labels' nearest neighbors.
Moreover, a reconstruction module for recovering correct labels is incorporated
into the whole framework as a regularization term, such that the label
embedding space is more representative. Our model can be trained in an
end-to-end manner. Experimental results on publicly available image datasets
corroborate the efficacy of our method compared with the state-of-the-arts.
- Abstract(参考訳): 本稿では,マルチラベル画像分類問題に取り組むための新しい深層メトリック学習法を提案する。
画像の特徴とラベルの相関関係をよりよく学習するために、画像とラベルをそれぞれ2つのユニークなディープニューラルネットワークを介して埋め込む潜伏空間を探索する。
画像特徴量とラベル間の関係を捉えるため,画像とラベル間の距離は,画像とラベルの近傍との距離よりも小さいだけでなく,ラベルとラベルの近傍に対応する他の画像との間の距離よりも小さいという2つの異なる視点から,埋め込み空間上の遠方距離を学習することを目的としている。
また、適切なラベルを復元する再構成モジュールを、ラベル埋め込みスペースがより代表的であるように、正規化用語としてフレームワーク全体に組み込む。
私たちのモデルはエンドツーエンドでトレーニングできます。
公開画像データセットにおける実験結果は,最先端画像と比較し,本手法の有効性を検証した。
関連論文リスト
- Few-shot Class-Incremental Semantic Segmentation via Pseudo-Labeling and
Knowledge Distillation [3.4436201325139737]
セマンティックセグメンテーションモデルのための新しいクラスをいくつかの例から学習する問題に対処する。
限られたデータから学習するために、数発のトレーニングアノテーションを増強する擬似ラベル方式を提案する。
上記のステップを、統一的な学習目標を持つ単一の畳み込みニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2023-08-05T05:05:37Z) - Semantic-Aware Graph Matching Mechanism for Multi-Label Image
Recognition [21.36538164675385]
マルチラベル画像認識は、画像に存在するラベルの集合を予測することを目的としている。
本稿では、各画像をインスタンスの袋として扱い、複数ラベル画像認識のタスクをインスタンス-ラベルマッチング選択問題として定式化する。
マルチラベル画像認識(ML-SGM)のための革新的なセマンティック対応グラフマッチングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-21T23:48:01Z) - Dual-Perspective Semantic-Aware Representation Blending for Multi-Label
Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。
提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-26T00:33:44Z) - Structured Semantic Transfer for Multi-Label Recognition with Partial
Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。
このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。
Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2021-12-21T02:15:01Z) - Reference-guided Pseudo-Label Generation for Medical Semantic
Segmentation [25.76014072179711]
本稿では,半教師付きセマンティックセグメンテーションのための管理手法を提案する。
少数のラベル付き画像を参照材料として使用し、未ラベル画像中の画素と参照集合内の最適な画素のセマンティクスを一致させる。
我々は,X線解剖学的セグメンテーションにおける標準完全教師付きモデルと同じ性能を達成するが,ラベル付き画像の95%は少ない。
論文 参考訳(メタデータ) (2021-12-01T12:21:24Z) - Spatial-context-aware deep neural network for multi-class image
classification [12.961070515143161]
意味情報と空間情報の両方を考慮したラベル予測のために,空間コンテキストを考慮した深層ニューラルネットワークを提案する。
このフレームワークはMicrosoft COCOとPASCAL VOCで評価され、画像のマルチラベリングに広く使われているベンチマークデータセットである。
論文 参考訳(メタデータ) (2021-11-24T06:36:10Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - SSKD: Self-Supervised Knowledge Distillation for Cross Domain Adaptive
Person Re-Identification [25.96221714337815]
ドメイン適応型人物再識別(re-ID)は、ソースドメインとターゲットドメインの間に大きな違いがあるため、難しい課題である。
既存の手法は主にクラスタリングアルゴリズムによって未ラベルのターゲット画像の擬似ラベルを生成する。
本稿では,識別学習とソフトラベル学習の2つのモジュールを含む自己監督的知識蒸留(SSKD)手法を提案する。
論文 参考訳(メタデータ) (2020-09-13T10:12:02Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。