論文の概要: A Capsule Network for Hierarchical Multi-Label Image Classification
- arxiv url: http://arxiv.org/abs/2209.05723v1
- Date: Tue, 13 Sep 2022 04:17:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-14 12:29:53.748290
- Title: A Capsule Network for Hierarchical Multi-Label Image Classification
- Title(参考訳): 階層型マルチラベル画像分類のためのカプセルネットワーク
- Authors: Khondaker Tasrif Noor, Antonio Robles-Kelly, Brano Kusy
- Abstract要約: 階層的な多ラベル分類は、階層構造や分類に基づくより小さな分類に分類された多クラス画像分類問題に適用される。
階層分類のためのマルチラベルカプセルネットワーク(ML-CapsNet)を提案する。
- 参考スコア(独自算出の注目度): 2.507647327384289
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image classification is one of the most important areas in computer vision.
Hierarchical multi-label classification applies when a multi-class image
classification problem is arranged into smaller ones based upon a hierarchy or
taxonomy. Thus, hierarchical classification modes generally provide multiple
class predictions on each instance, whereby these are expected to reflect the
structure of image classes as related to one another. In this paper, we propose
a multi-label capsule network (ML-CapsNet) for hierarchical classification. Our
ML-CapsNet predicts multiple image classes based on a hierarchical class-label
tree structure. To this end, we present a loss function that takes into account
the multi-label predictions of the network. As a result, the training approach
for our ML-CapsNet uses a coarse to fine paradigm while maintaining consistency
with the structure in the classification levels in the label-hierarchy. We also
perform experiments using widely available datasets and compare the model with
alternatives elsewhere in the literature. In our experiments, our ML-CapsNet
yields a margin of improvement with respect to these alternative methods.
- Abstract(参考訳): 画像分類はコンピュータビジョンにおいて最も重要な分野の1つである。
階層的な多ラベル分類は、階層構造や分類に基づくより小さな分類に分類された多クラス画像分類問題に適用される。
したがって、階層的分類モードは一般に各インスタンスに複数のクラス予測を提供し、画像クラスの構造を相互に関連するものとして反映することが期待される。
本稿では,階層分類のためのマルチラベルカプセルネットワーク(ML-CapsNet)を提案する。
ML-CapsNetは階層的なクラスラベル木構造に基づいて複数の画像クラスを予測する。
そこで本研究では,ネットワークのマルチラベル予測を考慮した損失関数を提案する。
その結果、ML-CapsNetのトレーニングアプローチでは、ラベル階層の分類レベルの構造との整合性を保ちながら、粗いパラダイムを用いている。
また,広く利用可能なデータセットを用いて実験を行い,文献の他の代替案と比較した。
我々の実験では、ML-CapsNetはこれらの代替手法に関して改善の限界をもたらす。
関連論文リスト
- Harnessing Superclasses for Learning from Hierarchical Databases [1.835004446596942]
多くの大規模分類問題において、クラスは既知の階層に整理され、通常木として表される。
この種の教師付き階層分類の損失について紹介する。
提案手法では,クロスエントロピーの損失に比較して,計算コストの大幅な増大は伴わない。
論文 参考訳(メタデータ) (2024-11-25T14:39:52Z) - Semantic Guided Level-Category Hybrid Prediction Network for
Hierarchical Image Classification [8.456482280676884]
階層分類(HC)は、各オブジェクトに階層構造にまとめられた複数のラベルを割り当てる。
本稿では,そのレベルとカテゴリの予測をエンドツーエンドで共同で行うことのできる,セマンティックガイド付き階層型ハイブリッド予測ネットワーク(SGLCHPN)を提案する。
論文 参考訳(メタデータ) (2022-11-22T13:49:10Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - Deep Hierarchical Semantic Segmentation [76.40565872257709]
階層的セマンティックセマンティックセグメンテーション(HSS)は、クラス階層の観点で視覚的観察を構造化、ピクセル単位で記述することを目的としている。
HSSNは、HSSを画素単位のマルチラベル分類タスクとしてキャストし、現在のセグメンテーションモデルに最小限のアーキテクチャ変更をもたらすだけである。
階層構造によって引き起こされるマージンの制約により、HSSNはピクセル埋め込み空間を再評価し、よく構造化されたピクセル表現を生成する。
論文 参考訳(メタデータ) (2022-03-27T15:47:44Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Label Hierarchy Transition: Delving into Class Hierarchies to Enhance
Deep Classifiers [40.993137740456014]
本稿では,階層型分類の課題に対処するために,ディープラーニングに基づく統一確率的フレームワークを提案する。
提案するフレームワークは、わずかに修正するだけで、既存のディープネットワークに容易に適応できる。
提案するLHTフレームワークを皮膚病変診断タスクに拡張し,コンピュータ支援診断におけるその大きな可能性を検証した。
論文 参考訳(メタデータ) (2021-12-04T14:58:36Z) - Convolutional Neural Networks from Image Markers [62.997667081978825]
特徴 画像マーカーからの学習(FLIM)は、ごく少数の画像でユーザーが描画したストロークから、バックプロパゲーションのない畳み込みフィルタを推定するために最近提案されました。
本稿では、フルコネクテッド層に対してFLIMを拡張し、異なる画像分類問題について実証する。
その結果、FLIMベースの畳み込みニューラルネットワークは、バックプロパゲーションによってゼロから訓練された同じアーキテクチャを上回ります。
論文 参考訳(メタデータ) (2020-12-15T22:58:23Z) - Attribute Propagation Network for Graph Zero-shot Learning [57.68486382473194]
属性伝達ネットワーク (APNet) を導入し, 1) クラス毎に属性ベクトルを生成するグラフ伝搬モデルと, 2) パラメータ化隣人 (NN) 分類器から構成する。
APNetは、2つのゼロショット学習設定と5つのベンチマークデータセットによる実験で、魅力的なパフォーマンスまたは新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-24T16:53:40Z) - Learn Class Hierarchy using Convolutional Neural Networks [0.9569316316728905]
画像の階層的分類のための新しいアーキテクチャを提案し、クロスエントロピー損失関数と中心損失を組み合わせた深層線形層を導入する。
階層型分類器は,コンピュータビジョンタスクへの応用を見出す従来の分類手法の利点を示す。
論文 参考訳(メタデータ) (2020-05-18T12:06:43Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Multilayer Dense Connections for Hierarchical Concept Classification [3.6093339545734886]
同じCNNで階層的な順序でカテゴリとその概念上のスーパークラスを同時予測するための多層密接続を提案する。
提案するネットワークは,複数のデータセットにおいて既存のアルゴリズムよりも粗いスーパークラスと細かなカテゴリの両方を同時に予測できることを実験的に実証した。
論文 参考訳(メタデータ) (2020-03-19T20:56:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。