論文の概要: Fine-Grained Visual Classification via Progressive Multi-Granularity
Training of Jigsaw Patches
- arxiv url: http://arxiv.org/abs/2003.03836v3
- Date: Sun, 19 Jul 2020 06:56:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 14:34:00.555578
- Title: Fine-Grained Visual Classification via Progressive Multi-Granularity
Training of Jigsaw Patches
- Title(参考訳): jigsawパッチのプログレッシブ多粒度トレーニングによる細粒度視覚分類
- Authors: Ruoyi Du, Dongliang Chang, Ayan Kumar Bhunia, Jiyang Xie, Zhanyu Ma,
Yi-Zhe Song, Jun Guo
- Abstract要約: きめ細かい視覚分類(FGVC)は従来の分類よりもはるかに難しい。
最近の研究は主に、最も差別的な部分の発見に焦点をあてることによってこの問題に対処している。
本稿では,これらの問題に対処するための視覚的細粒度分類のための新しい枠組みを提案する。
- 参考スコア(独自算出の注目度): 67.51747235117
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fine-grained visual classification (FGVC) is much more challenging than
traditional classification tasks due to the inherently subtle intra-class
object variations. Recent works mainly tackle this problem by focusing on how
to locate the most discriminative parts, more complementary parts, and parts of
various granularities. However, less effort has been placed to which
granularities are the most discriminative and how to fuse information cross
multi-granularity. In this work, we propose a novel framework for fine-grained
visual classification to tackle these problems. In particular, we propose: (i)
a progressive training strategy that effectively fuses features from different
granularities, and (ii) a random jigsaw patch generator that encourages the
network to learn features at specific granularities. We obtain state-of-the-art
performances on several standard FGVC benchmark datasets, where the proposed
method consistently outperforms existing methods or delivers competitive
results. The code will be available at
https://github.com/PRIS-CV/PMG-Progressive-Multi-Granularity-Training.
- Abstract(参考訳): 微粒な視覚分類(FGVC)は、本質的に微妙なクラス内オブジェクトの変化のため、従来の分類タスクよりもはるかに難しい。
最近の研究は主に、最も識別的な部分、より補足的な部分、および様々な粒状物の部分を見つける方法に焦点を当ててこの問題に取り組んでいる。
しかし、どの粒度が最も差別的であるか、どのように情報を多粒性に融合するか、といったことへの努力は少ない。
本研究では,これらの問題に対処するための視覚的きめ細かい分類のための新しい枠組みを提案する。
特に,我々は次のように提案する。
(i)異なる粒度から効果的に特徴を融合させる漸進的な訓練戦略
(ii)ネットワークが特定の粒度で特徴を学習することを奨励するランダムjigsawパッチジェネレータ。
提案手法は, 既存の手法を一貫して上回ったり, 競争力のある結果をもたらすなど, 標準のfgvcベンチマークデータセットで最先端のパフォーマンスを得る。
コードはhttps://github.com/PRIS-CV/PMG-Progressive-Multi-Granularity-Trainingで入手できる。
関連論文リスト
- Towards Generative Class Prompt Learning for Fine-grained Visual Recognition [5.633314115420456]
ジェネレーティブ・クラス・プロンプト・ラーニングとコントラスト・マルチクラス・プロンプト・ラーニングを紹介する。
Generative Class Prompt Learningは、学習可能なクラスプロンプトを持つ数ショットの例に条件付けすることで、クラス埋め込みにおける視覚言語相乗性を改善する。
CoMPLeはこの基盤の上に構築されており、クラス間の分離を促進する対照的な学習コンポーネントを導入している。
論文 参考訳(メタデータ) (2024-09-03T12:34:21Z) - Efficient Prompt Tuning of Large Vision-Language Model for Fine-Grained
Ship Classification [62.425462136772666]
リモートセンシング(RS-FGSC)における船のきめ細かい分類は、クラス間の高い類似性とラベル付きデータの限られた可用性のために大きな課題となる。
大規模な訓練済みビジョンランゲージモデル(VLM)の最近の進歩は、少数ショット学習やゼロショット学習において印象的な能力を示している。
本研究は, 船種別分類精度を高めるために, VLMの可能性を生かしたものである。
論文 参考訳(メタデータ) (2024-03-13T05:48:58Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Hierarchical Forgery Classifier On Multi-modality Face Forgery Clues [61.37306431455152]
我々は,HFC-MFFD (hierarchical Forgery for Multi-modality Face Forgery Detection) を提案する。
HFC-MFFDは、マルチモーダルシナリオにおけるフォージェリー認証を強化するために、堅牢なパッチベースのハイブリッド表現を学習する。
クラス不均衡問題を緩和し、さらに検出性能を高めるために、特定の階層的な顔偽造を提案する。
論文 参考訳(メタデータ) (2022-12-30T10:54:29Z) - R2-Trans:Fine-Grained Visual Categorization with Redundancy Reduction [21.11038841356125]
細粒度視覚分類(FGVC)は、クラス内の大きな多様性と微妙なクラス間差が主な課題である類似のサブカテゴリを識別することを目的としている。
本稿では,FGVCに対する新たなアプローチを提案する。FGVCは,環境条件における部分的かつ十分な識別情報を同時に利用でき,また,対象物に対するクラストークンにおける冗長情報を圧縮することができる。
論文 参考訳(メタデータ) (2022-04-21T13:35:38Z) - Learning What Not to Segment: A New Perspective on Few-Shot Segmentation [63.910211095033596]
近年では、FSS ( few-shot segmentation) が広く開発されている。
本稿では,問題を緩和するための新鮮で直接的な知見を提案する。
提案されたアプローチのユニークな性質を踏まえて、より現実的で挑戦的な設定にまで拡張する。
論文 参考訳(メタデータ) (2022-03-15T03:08:27Z) - A Compositional Feature Embedding and Similarity Metric for
Ultra-Fine-Grained Visual Categorization [16.843126268445726]
きめ細かい視覚分類(FGVC)は、クラス間の差異が小さいオブジェクトを分類することを目的としている。
本稿では,超微細な視覚分類のための新しい構成的特徴埋め込みと類似度指標(CECS)を提案する。
最近のベンチマーク手法を用いた2つの超FGVCデータセットと1つのFGVCデータセットの実験結果から,提案手法が最先端性能を実現することを一貫して示している。
論文 参考訳(メタデータ) (2021-09-25T15:05:25Z) - Learning Discriminative Representations for Multi-Label Image
Recognition [13.13795708478267]
マルチラベルタスクにおける識別的特徴を学習するための統合深層ネットワークを提案する。
ネットワーク全体を正規化することで、よく知られたResNet-101の適用性能が大幅に向上する。
論文 参考訳(メタデータ) (2021-07-23T12:10:46Z) - Interpretable Attention Guided Network for Fine-grained Visual
Classification [36.657203916383594]
細かい粒度の視覚分類(FGVC)は困難ですが、従来の分類タスクよりも重要です。
細粒度視覚分類のための解釈型注意誘導ネットワーク(IAGN)を提案する。
論文 参考訳(メタデータ) (2021-03-08T12:27:51Z) - Attention Model Enhanced Network for Classification of Breast Cancer
Image [54.83246945407568]
AMENはマルチブランチ方式で、画素ワイドアテンションモデルとサブモジュールの分類で定式化される。
微妙な詳細情報に焦点を合わせるため、サンプル画像は、前枝から生成された画素対応の注目マップによって強化される。
3つのベンチマークデータセットで行った実験は、様々なシナリオにおいて提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2020-10-07T08:44:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。