論文の概要: Re-rank Coarse Classification with Local Region Enhanced Features for
Fine-Grained Image Recognition
- arxiv url: http://arxiv.org/abs/2102.09875v1
- Date: Fri, 19 Feb 2021 11:30:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-22 13:27:57.451982
- Title: Re-rank Coarse Classification with Local Region Enhanced Features for
Fine-Grained Image Recognition
- Title(参考訳): 微粒画像認識のための局所領域強調特徴を用いた再ランク粗い分類
- Authors: Shaokang Yang, Shuai Liu, Cheng Yang, Changhu Wang
- Abstract要約: そこで我々は,Top1の精度を向上させるため,TopN分類結果を局所的に拡張した埋め込み機能を用いて再評価した。
より効果的なセマンティクスグローバル機能を学ぶために、我々は、自動構築された階層的カテゴリ構造上のマルチレベル損失をデザインする。
本手法は,cub-200-2011,stanford cars,fgvc aircraftの3つのベンチマークで最新性能を実現する。
- 参考スコア(独自算出の注目度): 22.83821575990778
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fine-grained image recognition is very challenging due to the difficulty of
capturing both semantic global features and discriminative local features.
Meanwhile, these two features are not easy to be integrated, which are even
conflicting when used simultaneously. In this paper, a retrieval-based
coarse-to-fine framework is proposed, where we re-rank the TopN classification
results by using the local region enhanced embedding features to improve the
Top1 accuracy (based on the observation that the correct category usually
resides in TopN results). To obtain the discriminative regions for
distinguishing the fine-grained images, we introduce a weakly-supervised method
to train a box generating branch with only image-level labels. In addition, to
learn more effective semantic global features, we design a multi-level loss
over an automatically constructed hierarchical category structure. Experimental
results show that our method achieves state-of-the-art performance on three
benchmarks: CUB-200-2011, Stanford Cars, and FGVC Aircraft. Also,
visualizations and analysis are provided for better understanding.
- Abstract(参考訳): 微細な画像認識は、意味的グローバル特徴と識別的局所特徴の両方を捉えるのが難しいため、非常に難しい。
一方、これら2つの機能は統合が容易ではなく、同時に使用する場合にも相反する。
本稿では,TopNの分類結果を局所的に拡張した埋め込み機能を用いて再分類し,TopNの精度を向上する検索に基づく粗粒度分類フレームワークを提案する。
細粒画像を区別するための識別領域を得るため, 画像レベルラベルのみを用いて, ボックス生成ブランチを訓練する弱監督法を提案する。
さらに、より効果的なセマンティックグローバル機能を学ぶために、自動構築された階層的カテゴリ構造に対するマルチレベル損失をデザインする。
実験結果から,CUB-200-2011,Stanford Cars,FGVC Aircraftの3つのベンチマークにおいて,最先端の性能が得られた。
また、より深い理解のために可視化と分析が提供される。
関連論文リスト
- Siamese Transformer Networks for Few-shot Image Classification [9.55588609556447]
人間は視覚分類タスクにおいて顕著な熟練度を示し、最小限の例で新しい画像を正確に認識し分類する。
既存の少数の画像分類手法は、大域的特徴と局所的特徴の両方を強調し、両者を統合することを考える研究はほとんどない。
我々は,シームズ変圧器ネットワーク(STN)に基づく新しいアプローチを提案する。
我々の戦略は, 複雑な特徴適応モジュールの必要性を回避し, 画像分類におけるグローバルな特徴と局所的な特徴の可能性を効果的に活用する。
論文 参考訳(メタデータ) (2024-07-16T14:27:23Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - DenseGAP: Graph-Structured Dense Correspondence Learning with Anchor
Points [15.953570826460869]
2つの画像間の密接な対応を確立することは、基本的なコンピュータビジョンの問題である。
我々は、アンカーポイントに条件付きグラフ構造化ニューラルネットワークを用いたDense対応学習のための新しいソリューションであるDenseGAPを紹介する。
提案手法は,ほとんどのベンチマークにおいて対応学習の最先端化を図っている。
論文 参考訳(メタデータ) (2021-12-13T18:59:30Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - Weakly-supervised Object Localization for Few-shot Learning and
Fine-grained Few-shot Learning [0.5156484100374058]
少数のサンプルから新しい視覚カテゴリーを学習することを目的としている。
本稿では,自己認識型補完モジュール(SACモジュール)を提案する。
また,数発の分類のために,識別的深層記述子を選択するためのアクティブマスクも生成する。
論文 参考訳(メタデータ) (2020-03-02T14:07:05Z) - Weakly Supervised Attention Pyramid Convolutional Neural Network for
Fine-Grained Visual Classification [71.96618723152487]
注意ピラミッド畳み込みニューラルネットワーク(AP-CNN)について紹介する。
AP-CNNは高レベルのセマンティックと低レベルの詳細な特徴表現の両方を学ぶ。
追加のバウンディングボックス/パートアノテーションを必要とせずに、エンドツーエンドでトレーニングすることができる。
論文 参考訳(メタデータ) (2020-02-09T12:33:23Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。