論文の概要: FGDCC: Fine-Grained Deep Cluster Categorization -- A Framework for Intra-Class Variability Problems in Plant Classification
- arxiv url: http://arxiv.org/abs/2512.19960v1
- Date: Tue, 23 Dec 2025 01:14:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.704143
- Title: FGDCC: Fine-Grained Deep Cluster Categorization -- A Framework for Intra-Class Variability Problems in Plant Classification
- Title(参考訳): FGDCC: 植物分類におけるクラス内変数問題のためのフレームワーク
- Authors: Luciano Araujo Dourado Filho, Rodrigo Tripodi Calumby,
- Abstract要約: 本稿では,細粒度視覚分類タスクにおける分類性能の活用を目的とした新しい手法を提案する。
我々のゴールは、各クラスにクラスタリングを適用することで、画像間の潜在的な類似度を符号化する擬似ラベルを発見できるようにすることです。
我々の手法は、まだ完全に最適化されていないコンポーネントがいくつかあるにもかかわらず、PlantNet300kデータセット上で最先端のパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 0.6445605125467574
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intra-class variability is given according to the significance in the degree of dissimilarity between images within a class. In that sense, depending on its intensity, intra-class variability can hinder the learning process for DL models, specially when such classes are also underrepresented, which is a very common scenario in Fine-Grained Visual Categorization (FGVC) tasks. This paper proposes a novel method that aims at leveraging classification performance in FGVC tasks by learning fine-grained features via classification of class-wise cluster assignments. Our goal is to apply clustering over each class individually, which can allow to discover pseudo-labels that encodes a latent degree of similarity between images. In turn, those labels can be employed in a hierarchical classification process that allows to learn more fine-grained visual features and thereby mitigating intra-class variability issues. Initial experiments over the PlantNet300k enabled to shed light upon several key points in which future work will have to be developed in order to find more conclusive evidence regarding the effectiveness of our method. Our method still achieves state-of-the-art performance on the PlantNet300k dataset even though some of its components haven't been shown to be fully optimized. Our code is available at \href{https://github.com/ADAM-UEFS/FGDCC}{https://github.com/ADAM-UEFS/FGDCC}.
- Abstract(参考訳): クラス内変動は、クラス内の画像間の相違の度合いの重要度に応じて与えられる。
その意味では、クラス内変動はDLモデルの学習過程を阻害し、特にそのようなクラスが不足している場合には、FGVC(Fin-Grained Visual Categorization)タスクにおいて非常に一般的なシナリオである。
本稿では,FGVCタスクにおける分類性能の活用を目的とした,クラスワイドクラスタ割り当ての分類によるきめ細かい特徴の学習手法を提案する。
我々のゴールは、各クラスにクラスタリングを適用することで、画像間の潜在的な類似度を符号化する擬似ラベルを発見できるようにすることです。
これにより、よりきめ細かい視覚的特徴を学習し、クラス内の変数問題を緩和することができる。
PlantNet300kに関する最初の実験は、我々の方法の有効性に関するより決定的な証拠を見つけるために、将来の作業が開発される必要があるいくつかの重要な点に光を当てることを可能にした。
我々の手法は、まだ完全に最適化されていないコンポーネントがいくつかあるにもかかわらず、PlantNet300kデータセット上で最先端のパフォーマンスを実現しています。
我々のコードは \href{https://github.com/ADAM-UEFS/FGDCC}{https://github.com/ADAM-UEFS/FGDCC} で入手できる。
関連論文リスト
- Zero-Shot Fine-Grained Image Classification Using Large Vision-Language Models [4.499940819352075]
LVLM(Large Vision-Language Models)は、視覚言語推論タスクにおいて顕著な性能を示す。
ゼロショットのきめ細かい画像分類を視覚的問合せフレームワークに変換する新しい手法を提案する。
提案手法は現状のSOTA(State-of-the-art)手法より一貫して優れている。
論文 参考訳(メタデータ) (2025-10-04T18:56:41Z) - EnGraf-Net: Multiple Granularity Branch Network with Fine-Coarse Graft Grained for Classification Task [0.8299692647308321]
きめ細かい分類モデルは、非常に類似したクラスを区別するために必要な関連する詳細に焦点を当てるように設計されている。
自動収穫法を含む部分的アプローチは、局所的特徴の不完全な表現に悩まされる。
本研究では,エングラフネット(EnGraf-Net)と呼ばれるエンドツーエンドのディープニューラルネットワークモデルにおいて,階層構造(分類)として構築されたセマンティックアソシエーションを教師付き信号として活用する。
論文 参考訳(メタデータ) (2025-09-25T12:11:42Z) - EIANet: A Novel Domain Adaptation Approach to Maximize Class Distinction with Neural Collapse Principles [15.19374752514876]
ソースフリードメイン適応(SFDA)は、ラベル付きソースドメインから未ラベルのターゲットドメインに知識を転送することを目的としている。
SFDAにおける大きな課題は、ターゲットドメインの正確な分類情報を導き出すことである。
クラスプロトタイプを分離するための新しいETF-Informed Attention Network(EIANet)を導入する。
論文 参考訳(メタデータ) (2024-07-23T05:31:05Z) - Exploration of Class Center for Fine-Grained Visual Classification [7.120809788357261]
きめ細かい視覚分類は、クラス内差と微妙なクラス間差のために難しい課題である。
本稿では,複数のクラス中心制約とクラス中心ラベル生成からなるクラス中心探索という損失関数を提案する。
本手法は,損失関数として既存の細粒度視覚分類手法と容易に統合でき,トレーニングコストをわずかに抑えることで,さらに優れた性能を向上することができる。
論文 参考訳(メタデータ) (2024-07-05T04:11:09Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Generative Multi-Label Zero-Shot Learning [136.17594611722285]
マルチラベルゼロショット学習は、トレーニング中にデータが入手できない複数の見えないカテゴリにイメージを分類する試みである。
我々の研究は、(一般化された)ゼロショット設定におけるマルチラベル機能の問題に最初に取り組みました。
私たちのクロスレベル核融合に基づく生成アプローチは、3つのデータセットすべてにおいて最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-01-27T18:56:46Z) - SCAN: Learning to Classify Images without Labels [73.69513783788622]
機能学習とクラスタリングを分離する2段階のアプローチを提唱する。
表現学習からの自己教師型タスクを用いて意味論的意味のある特徴を得る。
我々は、ImageNet上で有望な結果を得、低データ体制下では、いくつかの半教師付き学習方法より優れています。
論文 参考訳(メタデータ) (2020-05-25T18:12:33Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z) - Fine-Grained Visual Classification via Progressive Multi-Granularity
Training of Jigsaw Patches [67.51747235117]
きめ細かい視覚分類(FGVC)は従来の分類よりもはるかに難しい。
最近の研究は主に、最も差別的な部分の発見に焦点をあてることによってこの問題に対処している。
本稿では,これらの問題に対処するための視覚的細粒度分類のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-08T19:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。