論文の概要: Learning Representations For Images With Hierarchical Labels
- arxiv url: http://arxiv.org/abs/2004.00909v2
- Date: Sat, 11 Apr 2020 17:51:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 09:28:09.110294
- Title: Learning Representations For Images With Hierarchical Labels
- Title(参考訳): 階層ラベルを用いた画像表現の学習
- Authors: Ankit Dhall
- Abstract要約: クラスラベルによって誘導されるセマンティック階層に関する情報を活用するための一連の手法を提案する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の提供により、全体的な性能が向上することを示す。
しかし,CNN分類器には階層的な情報が注入され,組込みベースモデルでは,新たに提示された実世界ETHエコロジーコレクションイメージデータセットの階層非依存モデルよりも優れていた。
- 参考スコア(独自算出の注目度): 1.3579420996461438
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image classification has been studied extensively but there has been limited
work in the direction of using non-conventional, external guidance other than
traditional image-label pairs to train such models. In this thesis we present a
set of methods to leverage information about the semantic hierarchy induced by
class labels. In the first part of the thesis, we inject label-hierarchy
knowledge to an arbitrary classifier and empirically show that availability of
such external semantic information in conjunction with the visual semantics
from images boosts overall performance. Taking a step further in this
direction, we model more explicitly the label-label and label-image
interactions by using order-preserving embedding-based models, prevalent in
natural language, and tailor them to the domain of computer vision to perform
image classification. Although, contrasting in nature, both the CNN-classifiers
injected with hierarchical information, and the embedding-based models
outperform a hierarchy-agnostic model on the newly presented, real-world ETH
Entomological Collection image dataset
https://www.research-collection.ethz.ch/handle/20.500.11850/365379.
- Abstract(参考訳): 画像分類は広範に研究されてきたが、従来のイメージラベルペア以外の非伝統的な外部ガイダンスを用いてそのようなモデルを訓練する方向に限定的な研究がなされている。
本論文では,クラスラベルによって誘導されるセマンティック階層に関する情報を活用する手法について述べる。
論文の前半では,任意の分類器にラベル階層の知識を注入し,画像からの視覚的セマンティクスと組み合わせた外部意味情報の活用が全体的な性能を高めることを実証的に示す。
この方向をさらに一歩進めて,自然言語で広く普及する順序保存埋め込みモデルを用いて,ラベルラベルとラベルと画像の相互作用をより明確にモデル化し,それらをコンピュータビジョンの領域に調整して画像分類を行う。
対照的に、cnn分類器は階層的な情報を注入し、埋め込みベースのモデルは、新しく提示された現実世界のeth 昆虫学コレクション画像データセットhttps://www.research-collection.ethz.ch/handle/20.500.11850/365379で階層に依存しないモデルを上回る。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Few-shot Semantic Image Synthesis with Class Affinity Transfer [23.471210664024067]
そこで本研究では,大規模なデータセット上でトレーニングされたモデルを利用して,小規模なターゲットデータセット上での学習能力を向上させるトランスファー手法を提案する。
クラス親和性行列は、ターゲットラベルマップと互換性を持たせるために、ソースモデルの第一層として導入される。
セマンティック・セマンティック・シンセサイザー(セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・アーキテクチャー)にアプローチを適用する。
論文 参考訳(メタデータ) (2023-04-05T09:24:45Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Semantic Disentangling Generalized Zero-Shot Learning [50.259058462272435]
Generalized Zero-Shot Learning (GZSL)は、目に見えないカテゴリと見えないカテゴリの両方から画像を認識することを目的としている。
本稿では,エンコーダ・デコーダアーキテクチャに基づく新しい特徴分割手法を提案する。
提案モデルは,視像の固有特徴をキャプチャする品質意味一貫性表現を蒸留することを目的としている。
論文 参考訳(メタデータ) (2021-01-20T05:46:21Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Multi-label Zero-shot Classification by Learning to Transfer from
External Knowledge [36.04579549557464]
マルチラベルゼロショット分類は、入力画像に対する複数の未知のクラスラベルを予測することを目的としている。
本稿では,外部知識の伝達を学習することで,新たなゼロショット分類フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-30T17:26:46Z) - Zero-Shot Recognition through Image-Guided Semantic Classification [9.291055558504588]
ゼロショット学習(ZSL)のための新しい埋め込み型フレームワークを提案する。
複数ラベル分類のための2値関係法により,画像と意味分類器のマッピングを逆学習する手法を提案する。
IGSCは概念的には単純であり、分類のための既存のディープアーキテクチャをわずかに拡張することで実現可能である。
論文 参考訳(メタデータ) (2020-07-23T06:22:40Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Semantic Pyramid for Image Generation [41.85213024720986]
本稿では,事前学習した分類モデルから学習した深部特徴空間を利用した新しいGANモデルを提案する。
古典的な画像ピラミッド表現に触発されて、我々はセマンティック・ジェネレーション・ピラミッドとしてモデルを構築した。
論文 参考訳(メタデータ) (2020-03-13T12:23:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。