論文の概要: Hierarchical Image Classification with A Literally Toy Dataset
- arxiv url: http://arxiv.org/abs/2111.00892v1
- Date: Mon, 1 Nov 2021 12:35:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-02 15:33:15.766887
- Title: Hierarchical Image Classification with A Literally Toy Dataset
- Title(参考訳): リテラリートイデータセットを用いた階層画像分類
- Authors: Long He, Dandan Song, Liang Zheng
- Abstract要約: この研究は、Lego-15という新しいデータセットで行われます。レゴのブロックの合成画像と実際の画像で構成され、Lego-15データセットには15種類のブロックが含まれています。
クラスが上述の特徴を持つ分類タスクを定義し、フラットクラスとベースクラスは階層的に階層的な画像分類として構成される。
具体的には、階層ラベルとUDA技術で教師付き特徴抽出器を訓練し、入力画像の複数の特徴を出力する。
- 参考スコア(独自算出の注目度): 16.938432494176627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised domain adaptation (UDA) in image classification remains a big
challenge. In existing UDA image dataset, classes are usually organized in a
flattened way, where a plain classifier can be trained. Yet in some scenarios,
the flat categories originate from some base classes. For example, buggies
belong to the class bird. We define the classification task where classes have
characteristics above and the flat classes and the base classes are organized
hierarchically as hierarchical image classification. Intuitively, leveraging
such hierarchical structure will benefit hierarchical image classification,
e.g., two easily confusing classes may belong to entirely different base
classes. In this paper, we improve the performance of classification by fusing
features learned from a hierarchy of labels. Specifically, we train feature
extractors supervised by hierarchical labels and with UDA technology, which
will output multiple features for an input image. The features are subsequently
concatenated to predict the finest-grained class. This study is conducted with
a new dataset named Lego-15. Consisting of synthetic images and real images of
the Lego bricks, the Lego-15 dataset contains 15 classes of bricks. Each class
originates from a coarse-level label and a middle-level label. For example,
class "85080" is associated with bricks (coarse) and bricks round (middle). In
this dataset, we demonstrate that our method brings about consistent
improvement over the baseline in UDA in hierarchical image classification.
Extensive ablation and variant studies provide insights into the new dataset
and the investigated algorithm.
- Abstract(参考訳): 画像分類における教師なし領域適応(UDA)は依然として大きな課題である。
既存のUDAイメージデータセットでは、クラスは通常フラットな方法で整理され、平易な分類器を訓練することができる。
しかし、いくつかのシナリオでは、フラットなカテゴリはいくつかのベースクラスに由来する。
例えば、バギーはクラス鳥に属する。
階層的画像分類として,クラスが上述の特徴を持ち,フラットクラスとベースクラスが階層的に分類される分類タスクを定義する。
直感的には、このような階層構造を活用することは、階層的なイメージ分類に役立つ。
本稿では,ラベル階層から学習した特徴を融合させて分類性能を向上させる。
具体的には,階層ラベルとUDA技術を用いて特徴抽出器を訓練し,入力画像の複数の特徴を出力する。
それらの機能は、最後にきめ細かいクラスを予測するために結合される。
この研究はlego-15という新しいデータセットで行われます。
lego-15のデータセットには、レゴブロックの合成画像と実際の画像が15種類含まれています。
各クラスは粗いレベルラベルと中間レベルラベルに由来する。
例えば、"85080"クラスは、レンガ(粗い)とレンガ(中間)に関連付けられている。
本稿では,本手法が階層画像分類におけるUDAのベースラインを一貫した改善をもたらすことを示す。
大規模なアブレーションと変種研究は、新しいデータセットと調査アルゴリズムに関する洞察を提供する。
関連論文リスト
- Lidar Panoptic Segmentation in an Open World [50.094491113541046]
ライダーパノプティクス(LPS)は自動運転車の安全な配備に不可欠である。
LPSは、セマンティッククラスの事前に定義された語彙であるライダーポイントを認識し、セグメント化することを目的としている。
階層的な方法で入力クラウドのクラスタリングとオーバーセグメンテーションを提案し,次にバイナリポイントセグメント分類を行う。
論文 参考訳(メタデータ) (2024-09-22T00:10:20Z) - DXAI: Explaining Classification by Image Decomposition [4.013156524547072]
我々は、分解に基づく説明可能なAI(DXAI)を用いてニューラルネットワークの分類を可視化する新しい方法を提案する。
本手法は,説明熱マップを提供する代わりに,画像のクラス非依存部分とクラス固有部分への分解を行う。
論文 参考訳(メタデータ) (2023-12-30T20:52:20Z) - Hierarchical Fine-Grained Image Forgery Detection and Localization [24.595585815686007]
IFDL表現学習のための階層的きめ細かい定式化を提案する。
まず、複数のラベルを異なるレベルのラベルで操作した画像の偽属性を表現します。
その結果、アルゴリズムは、様々なフォージェリー属性の包括的特徴と固有の階層性の両方を学ぶことを奨励されている。
論文 参考訳(メタデータ) (2023-03-30T02:51:52Z) - A Capsule Network for Hierarchical Multi-Label Image Classification [2.507647327384289]
階層的な多ラベル分類は、階層構造や分類に基づくより小さな分類に分類された多クラス画像分類問題に適用される。
階層分類のためのマルチラベルカプセルネットワーク(ML-CapsNet)を提案する。
論文 参考訳(メタデータ) (2022-09-13T04:17:08Z) - Attribute Group Editing for Reliable Few-shot Image Generation [85.52840521454411]
本稿では,画像生成のための新しい編集手法,すなわちAttribute Group Editing (AGE)を提案する。
AGEは、GANで学んだ内部表現を調べ、意味的に意味のある方向を識別する。
論文 参考訳(メタデータ) (2022-03-16T06:54:09Z) - Label Hierarchy Transition: Delving into Class Hierarchies to Enhance
Deep Classifiers [40.993137740456014]
本稿では,階層型分類の課題に対処するために,ディープラーニングに基づく統一確率的フレームワークを提案する。
提案するフレームワークは、わずかに修正するだけで、既存のディープネットワークに容易に適応できる。
提案するLHTフレームワークを皮膚病変診断タスクに拡張し,コンピュータ支援診断におけるその大きな可能性を検証した。
論文 参考訳(メタデータ) (2021-12-04T14:58:36Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Attribute Propagation Network for Graph Zero-shot Learning [57.68486382473194]
属性伝達ネットワーク (APNet) を導入し, 1) クラス毎に属性ベクトルを生成するグラフ伝搬モデルと, 2) パラメータ化隣人 (NN) 分類器から構成する。
APNetは、2つのゼロショット学習設定と5つのベンチマークデータセットによる実験で、魅力的なパフォーマンスまたは新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-24T16:53:40Z) - TreeGAN: Incorporating Class Hierarchy into Image Generation [16.94626320879776]
条件画像生成(CIG)はコンピュータビジョンと機械学習において広く研究されている問題である。
クラス階層を組み込む方法として,事前制御とポスト制約の2つを提案する。
ポスト制約では、画像が生成されると、クラス階層との整合性を測定し、一貫性スコアを使用してジェネレータのトレーニングをガイドする。
論文 参考訳(メタデータ) (2020-09-16T15:06:52Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。