論文の概要: EnGraf-Net: Multiple Granularity Branch Network with Fine-Coarse Graft Grained for Classification Task
- arxiv url: http://arxiv.org/abs/2509.21061v1
- Date: Thu, 25 Sep 2025 12:11:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.89266
- Title: EnGraf-Net: Multiple Granularity Branch Network with Fine-Coarse Graft Grained for Classification Task
- Title(参考訳): EnGraf-Net: 細粒度グラフトを用いた複数粒度分岐ネットワーク
- Authors: Riccardo La Grassa, Ignazio Gallo, Nicola Landro,
- Abstract要約: きめ細かい分類モデルは、非常に類似したクラスを区別するために必要な関連する詳細に焦点を当てるように設計されている。
自動収穫法を含む部分的アプローチは、局所的特徴の不完全な表現に悩まされる。
本研究では,エングラフネット(EnGraf-Net)と呼ばれるエンドツーエンドのディープニューラルネットワークモデルにおいて,階層構造(分類)として構築されたセマンティックアソシエーションを教師付き信号として活用する。
- 参考スコア(独自算出の注目度): 0.8299692647308321
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained classification models are designed to focus on the relevant details necessary to distinguish highly similar classes, particularly when intra-class variance is high and inter-class variance is low. Most existing models rely on part annotations such as bounding boxes, part locations, or textual attributes to enhance classification performance, while others employ sophisticated techniques to automatically extract attention maps. We posit that part-based approaches, including automatic cropping methods, suffer from an incomplete representation of local features, which are fundamental for distinguishing similar objects. While fine-grained classification aims to recognize the leaves of a hierarchical structure, humans recognize objects by also forming semantic associations. In this paper, we leverage semantic associations structured as a hierarchy (taxonomy) as supervised signals within an end-to-end deep neural network model, termed EnGraf-Net. Extensive experiments on three well-known datasets CIFAR-100, CUB-200-2011, and FGVC-Aircraft demonstrate the superiority of EnGraf-Net over many existing fine-grained models, showing competitive performance with the most recent state-of-the-art approaches, without requiring cropping techniques or manual annotations.
- Abstract(参考訳): 細粒度分類モデルは、特にクラス内分散が高く、クラス間分散が低い場合に、非常に類似したクラスを区別するために必要な関連する詳細に焦点を合わせるように設計されている。
既存のモデルの多くは、分類性能を高めるためにバウンディングボックス、部分位置、テキスト属性などの部分アノテーションに依存している。
自動収穫法を含む部分的アプローチは局所的特徴の不完全表現に悩まされ、類似した物体の識別に基本的であると仮定する。
きめ細かい分類は階層構造の葉を認識することを目的としているが、人間は意味的関連を形成することによってオブジェクトを認識する。
本稿では,エングラフネット(EnGraf-Net)と呼ばれるエンドツーエンドのディープニューラルネットワークモデルにおいて,階層構造(分類)として構築された意味的関連を教師付き信号として活用する。
CIFAR-100、CUB-200-2011、FGVC-Aircraftの3つのよく知られたデータセットに対する大規模な実験は、既存の細粒度モデルよりもEnGraf-Netの方が優れていることを示した。
関連論文リスト
- Just Say the Word: Annotation-Free Fine-Grained Object Counting [22.31750687552324]
細粒度オブジェクトカウントは、クラスに依存しないカウントモデルにとって依然として大きな課題である。
カテゴリ名を与えられた場合、合成画像と擬似ラベルを用いてプロンプトからコンパクトな概念を組み込む。
この埋め込み条件は、凍結したカウンタからの生のオーバーカウントを正確にカテゴリー別推定に洗練する特殊化モジュールである。
論文 参考訳(メタデータ) (2025-04-16T02:05:47Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Fine-Grained Visual Classification using Self Assessment Classifier [12.596520707449027]
識別的特徴の抽出は、きめ細かい視覚的分類タスクにおいて重要な役割を担っている。
本稿では,画像とトップkの予測クラスを同時に活用する自己評価手法を提案する。
本手法は,CUB200-2011,Stanford Dog,FGVC Aircraft のデータセットに対して,最新の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-05-21T07:41:27Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - GAN for Vision, KG for Relation: a Two-stage Deep Network for Zero-shot
Action Recognition [33.23662792742078]
ゼロショット動作認識のための2段階のディープニューラルネットワークを提案する。
サンプリング段階では,授業の動作特徴と単語ベクトルによって訓練されたGAN(Generative Adversarial Network)を利用する。
分類段階において、アクションクラスの単語ベクトルと関連するオブジェクトの関係に基づいて知識グラフを構築する。
論文 参考訳(メタデータ) (2021-05-25T09:34:42Z) - Attribute Propagation Network for Graph Zero-shot Learning [57.68486382473194]
属性伝達ネットワーク (APNet) を導入し, 1) クラス毎に属性ベクトルを生成するグラフ伝搬モデルと, 2) パラメータ化隣人 (NN) 分類器から構成する。
APNetは、2つのゼロショット学習設定と5つのベンチマークデータセットによる実験で、魅力的なパフォーマンスまたは新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-24T16:53:40Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z) - Group Based Deep Shared Feature Learning for Fine-grained Image
Classification [31.84610555517329]
共有された特徴を明示的にモデル化し、その効果を除去し、拡張された分類結果を得るための新しいディープネットワークアーキテクチャを提案する。
我々はこのフレームワークをグループベースのDeep Shared Feature Learning (GSFL)と呼び、学習したネットワークをGSFL-Netと呼ぶ。
特殊オートエンコーダの重要な利点は、多用途であり、最先端のきめ細かい特徴抽出モデルと組み合わせて、それらと一緒にトレーニングすることで、パフォーマンスを直接改善できる点である。
論文 参考訳(メタデータ) (2020-04-04T00:01:11Z) - Weakly Supervised Attention Pyramid Convolutional Neural Network for
Fine-Grained Visual Classification [71.96618723152487]
注意ピラミッド畳み込みニューラルネットワーク(AP-CNN)について紹介する。
AP-CNNは高レベルのセマンティックと低レベルの詳細な特徴表現の両方を学ぶ。
追加のバウンディングボックス/パートアノテーションを必要とせずに、エンドツーエンドでトレーニングすることができる。
論文 参考訳(メタデータ) (2020-02-09T12:33:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。