論文の概要: Learning Class Unique Features in Fine-Grained Visual Classification
- arxiv url: http://arxiv.org/abs/2011.10951v2
- Date: Tue, 16 Mar 2021 13:43:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 12:18:37.863639
- Title: Learning Class Unique Features in Fine-Grained Visual Classification
- Title(参考訳): 細粒度視覚分類における学習クラスの特徴
- Authors: Runkai Zheng, Zhijia Yu, Yinqi Zhang, Chris Ding, Hei Victor Cheng, Li
Liu
- Abstract要約: 情報理論の観点から,各カテゴリに特徴の独自性を付与することにより,CNNのトレーニングを規則化することを提案する。
提案した最小値損失を補うために,選択した各特徴マップ間の正規化内積に基づく特徴冗長損失(FRL)を提案する。
- 参考スコア(独自算出の注目度): 20.59233720331779
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A major challenge in Fine-Grained Visual Classification (FGVC) is
distinguishing various categories with high inter-class similarity by learning
the feature that differentiate the details. Conventional cross entropy trained
Convolutional Neural Network (CNN) fails this challenge as it may suffer from
producing inter-class invariant features in FGVC. In this work, we innovatively
propose to regularize the training of CNN by enforcing the uniqueness of the
features to each category from an information theoretic perspective. To achieve
this goal, we formulate a minimax loss based on a game theoretic framework,
where a Nash equilibria is proved to be consistent with this regularization
objective. Besides, to prevent from a feasible solution of minimax loss that
may produce redundant features, we present a Feature Redundancy Loss (FRL)
based on normalized inner product between each selected feature map pair to
complement the proposed minimax loss. Superior experimental results on several
influential benchmarks along with visualization show that our method gives full
play to the performance of the baseline model without additional computation
and achieves comparable results with state-of-the-art models.
- Abstract(参考訳): 細粒度視覚分類(FGVC)における大きな課題は、細部を区別する特徴を学習することで、クラス間類似度の高い様々なカテゴリを区別することである。
従来のクロスエントロピー訓練された畳み込みニューラルネットワーク(CNN)は、FGVCのクラス間不変機能の生成に苦しむ可能性があるため、この課題に失敗する。
本研究は,情報理論的な観点から各カテゴリの特徴のユニークさを強制することにより,cnnの訓練の規則化を革新的に提案する。
この目標を達成するために、ゲーム理論の枠組みに基づいてミニマックス損失を定式化し、nash平衡がこの正規化目標と一致することが証明される。
さらに、冗長な特徴を生じる可能性のあるミニマックス損失の可能な解を避けるため、選択された各特徴写像対間の正規化内積に基づく特徴冗長損失(FRL)を提案し、提案したミニマックス損失を補完する。
有意なベンチマークの優れた実験結果と可視化の結果から,本手法はベースラインモデルの性能に新たな計算をすることなくフルに発揮でき,最先端モデルと同等の結果が得られることがわかった。
関連論文リスト
- Enhancing Fine-Grained Visual Recognition in the Low-Data Regime Through Feature Magnitude Regularization [23.78498670529746]
抽出した特徴量の均等分布を保証するために正規化手法を導入する。
その明らかな単純さにもかかわらず、我々の手法は様々な細粒度視覚認識データセットに対して顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-03T07:32:46Z) - Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - Regularization Through Simultaneous Learning: A Case Study on Plant
Classification [0.0]
本稿では,トランスファーラーニングとマルチタスクラーニングの原則に基づく正規化アプローチである同時学習を紹介する。
我々は、ターゲットデータセットであるUFOP-HVDの補助データセットを活用し、カスタマイズされた損失関数でガイドされた同時分類を容易にする。
興味深いことに,本手法は正規化のないモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-22T19:44:57Z) - Neural Collapse Inspired Feature-Classifier Alignment for Few-Shot Class
Incremental Learning [120.53458753007851]
FSCIL(Few-shot class-incremental Learning)は、新しいセッションにおいて、新しいクラスごとにいくつかのトレーニングサンプルしかアクセスできないため、難しい問題である。
我々は最近発見された神経崩壊現象にインスパイアされたFSCILのこの不整合ジレンマに対処する。
我々は、FSCILのための神経崩壊誘発フレームワークを提案する。MiniImageNet、CUB-200、CIFAR-100データセットの実験により、提案したフレームワークが最先端のパフォーマンスより優れていることを示す。
論文 参考訳(メタデータ) (2023-02-06T18:39:40Z) - Discriminability-enforcing loss to improve representation learning [20.4701676109641]
我々は、個々の高次特徴のエントロピーを最小化するために、ジニ不純物にインスパイアされた新しい損失項を導入する。
我々のGini損失は高い差別的特徴をもたらすが、高レベルの特徴の分布がクラスの分布と一致していることを保証するものではない。
実験結果から,新たな損失項をトレーニング目標に組み込むことで,クロスエントロピー単独でトレーニングしたモデルよりも一貫して優れた結果が得られた。
論文 参考訳(メタデータ) (2022-02-14T22:31:37Z) - A Compositional Feature Embedding and Similarity Metric for
Ultra-Fine-Grained Visual Categorization [16.843126268445726]
きめ細かい視覚分類(FGVC)は、クラス間の差異が小さいオブジェクトを分類することを目的としている。
本稿では,超微細な視覚分類のための新しい構成的特徴埋め込みと類似度指標(CECS)を提案する。
最近のベンチマーク手法を用いた2つの超FGVCデータセットと1つのFGVCデータセットの実験結果から,提案手法が最先端性能を実現することを一貫して示している。
論文 参考訳(メタデータ) (2021-09-25T15:05:25Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Frequency-aware Discriminative Feature Learning Supervised by
Single-Center Loss for Face Forgery Detection [89.43987367139724]
顔の偽造検出は、コンピュータビジョンへの関心をますます高めている。
近年の業績は良好なものとなっているが、いまだに無視できない問題がある。
本稿では,新しい周波数認識型特徴学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-16T14:17:17Z) - Unleashing the Power of Contrastive Self-Supervised Visual Models via
Contrast-Regularized Fine-Tuning [94.35586521144117]
コントラスト学習を微調整に適用することでさらにメリットが得られるか検討する。
本研究では,コントラスト正規化調律(core-tuning)を提案する。
論文 参考訳(メタデータ) (2021-02-12T16:31:24Z) - Equalization Loss for Long-Tailed Object Recognition [109.91045951333835]
最先端のオブジェクト検出手法は、大きな語彙と長い尾を持つデータセットでは依然として不十分である。
そこで本稿では,長期的希少なカテゴリーの課題に対処するために,同化損失という,シンプルだが効果的な損失を提案する。
LVISベンチマークでは,レアおよび共通カテゴリのAP利得が4.1%,レアおよび共通カテゴリが4.8%である。
論文 参考訳(メタデータ) (2020-03-11T09:14:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。