論文の概要: Interpretable Attention Guided Network for Fine-grained Visual
Classification
- arxiv url: http://arxiv.org/abs/2103.04701v2
- Date: Tue, 9 Mar 2021 02:15:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-10 12:22:41.391589
- Title: Interpretable Attention Guided Network for Fine-grained Visual
Classification
- Title(参考訳): 微粒な視覚分類のための解釈型注意誘導ネットワーク
- Authors: Zhenhuan Huang, Xiaoyue Duan, Bo Zhao, Jinhu L\"u, Baochang Zhang
- Abstract要約: 細かい粒度の視覚分類(FGVC)は困難ですが、従来の分類タスクよりも重要です。
細粒度視覚分類のための解釈型注意誘導ネットワーク(IAGN)を提案する。
- 参考スコア(独自算出の注目度): 36.657203916383594
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fine-grained visual classification (FGVC) is challenging but more critical
than traditional classification tasks. It requires distinguishing different
subcategories with the inherently subtle intra-class object variations.
Previous works focus on enhancing the feature representation ability using
multiple granularities and discriminative regions based on the attention
strategy or bounding boxes. However, these methods highly rely on deep neural
networks which lack interpretability. We propose an Interpretable Attention
Guided Network (IAGN) for fine-grained visual classification. The contributions
of our method include: i) an attention guided framework which can guide the
network to extract discriminitive regions in an interpretable way; ii) a
progressive training mechanism obtained to distill knowledge stage by stage to
fuse features of various granularities; iii) the first interpretable FGVC
method with a competitive performance on several standard FGVC benchmark
datasets.
- Abstract(参考訳): 細かい粒度の視覚分類(FGVC)は困難ですが、従来の分類タスクよりも重要です。
固有の微妙なクラス内オブジェクトのバリエーションで異なるサブカテゴリを区別する必要がある。
前回の研究では,注意戦略やバウンディングボックスに基づいて,複数の粒度と識別領域を用いた特徴表現能力の向上に重点を置いていた。
しかし、これらの手法は解釈性に欠ける深層ニューラルネットワークに大きく依存している。
細粒度視覚分類のための解釈型注意誘導ネットワーク(IAGN)を提案する。
本手法のコントリビューションは,ネットワークが解釈可能な方法で識別領域を抽出するための注意喚起フレームワークと,様々な粒度の特徴を融合させるための段階的に知識段階を抽出する段階的学習機構と,いくつかの標準FGVCベンチマークデータセット上での競合性能を有する最初の解釈可能なFGVC手法である。
関連論文リスト
- EIANet: A Novel Domain Adaptation Approach to Maximize Class Distinction with Neural Collapse Principles [15.19374752514876]
ソースフリードメイン適応(SFDA)は、ラベル付きソースドメインから未ラベルのターゲットドメインに知識を転送することを目的としている。
SFDAにおける大きな課題は、ターゲットドメインの正確な分類情報を導き出すことである。
クラスプロトタイプを分離するための新しいETF-Informed Attention Network(EIANet)を導入する。
論文 参考訳(メタデータ) (2024-07-23T05:31:05Z) - Delving into Multimodal Prompting for Fine-grained Visual Classification [57.12570556836394]
細粒度視覚分類(FGVC)は、より広いカテゴリーの細分化を分類する。
事前学習型視覚言語モデルの最近の進歩は、様々なハイレベル視覚タスクにおいて顕著な性能を示している。
対照的な言語画像サブカテゴリ(CLIP)モデルに基づいて,MP-FGVCと呼ばれる新しいマルチモーダルプロンプトソリューションを提案する。
論文 参考訳(メタデータ) (2023-09-16T07:30:52Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Salient Mask-Guided Vision Transformer for Fine-Grained Classification [48.1425692047256]
きめ細かい視覚分類(FGVC)は、コンピュータビジョンの問題である。
その主な難しさの1つは、最も差別的な階級間のばらつきを捉えることである。
シンプルで効果的なマスク誘導型視覚変換器(SM-ViT)を導入する。
論文 参考訳(メタデータ) (2023-05-11T19:24:33Z) - R2-Trans:Fine-Grained Visual Categorization with Redundancy Reduction [21.11038841356125]
細粒度視覚分類(FGVC)は、クラス内の大きな多様性と微妙なクラス間差が主な課題である類似のサブカテゴリを識別することを目的としている。
本稿では,FGVCに対する新たなアプローチを提案する。FGVCは,環境条件における部分的かつ十分な識別情報を同時に利用でき,また,対象物に対するクラストークンにおける冗長情報を圧縮することができる。
論文 参考訳(メタデータ) (2022-04-21T13:35:38Z) - Progressive Co-Attention Network for Fine-grained Visual Classification [20.838908090777885]
きめ細かい視覚分類は、同じカテゴリ内の複数のサブカテゴリに属する画像を認識することを目的としている。
既存のほとんどの方法は個々の画像のみを入力とする。
そこで本研究では,pca-net(progressive co-attention network)と呼ばれる効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T10:19:02Z) - Fine-Grained Visual Classification via Progressive Multi-Granularity
Training of Jigsaw Patches [67.51747235117]
きめ細かい視覚分類(FGVC)は従来の分類よりもはるかに難しい。
最近の研究は主に、最も差別的な部分の発見に焦点をあてることによってこの問題に対処している。
本稿では,これらの問題に対処するための視覚的細粒度分類のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-08T19:27:30Z) - Weakly Supervised Attention Pyramid Convolutional Neural Network for
Fine-Grained Visual Classification [71.96618723152487]
注意ピラミッド畳み込みニューラルネットワーク(AP-CNN)について紹介する。
AP-CNNは高レベルのセマンティックと低レベルの詳細な特徴表現の両方を学ぶ。
追加のバウンディングボックス/パートアノテーションを必要とせずに、エンドツーエンドでトレーニングすることができる。
論文 参考訳(メタデータ) (2020-02-09T12:33:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。