論文の概要: Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification
- arxiv url: http://arxiv.org/abs/2106.03432v1
- Date: Mon, 7 Jun 2021 09:03:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 18:01:23.458817
- Title: Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification
- Title(参考訳): channel dropblock: 細粒度視覚分類のための改良正規化法
- Authors: Yifeng Ding, Shuwei Dong, Yujun Tong, Zhanyu Ma, Bo Xiao, and Haibin
Ling
- Abstract要約: 既存のアプローチは主に、識別的部分を見つけるための注意機構や、高度にパラメータ化された特徴を弱教師付きで抽出する特徴符号化アプローチを導入することでこの問題に対処している。
本研究では,CDB(Channel DropBlock)と呼ばれる軽量で効果的な正規化手法を提案する。
- 参考スコア(独自算出の注目度): 58.07257910065007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classifying the sub-categories of an object from the same super-category
(e.g., bird) in a fine-grained visual classification (FGVC) task highly relies
on mining multiple discriminative features. Existing approaches mainly tackle
this problem by introducing attention mechanisms to locate the discriminative
parts or feature encoding approaches to extract the highly parameterized
features in a weakly-supervised fashion. In this work, we propose a lightweight
yet effective regularization method named Channel DropBlock (CDB), in
combination with two alternative correlation metrics, to address this problem.
The key idea is to randomly mask out a group of correlated channels during
training to destruct features from co-adaptations and thus enhance feature
representations. Extensive experiments on three benchmark FGVC datasets show
that CDB effectively improves the performance.
- Abstract(参考訳): オブジェクトのサブカテゴリを同じスーパーカテゴリ(例えば鳥)から細粒度視覚分類(FGVC)タスクで分類することは、複数の識別的特徴のマイニングに大きく依存する。
既存のアプローチでは,識別的部分の同定や特徴エンコード手法の導入により,高パラメータ化特徴を弱教師付きで抽出することで,この問題に主に対処している。
本研究では,この問題を解決するために,チャネルドロップブロック(cdb)と呼ばれる軽量かつ効果的な正規化手法を提案する。
鍵となるアイデアは、トレーニング中に関連チャネルのグループをランダムにマスクして、特徴を共適応から破壊し、特徴表現を強化することである。
3つのベンチマークFGVCデータセットの大規模な実験は、CDBがパフォーマンスを効果的に改善することを示している。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Prototypical Hash Encoding for On-the-Fly Fine-Grained Category Discovery [65.16724941038052]
カテゴリ対応プロトタイプ生成(CPG)とディスクリミカテゴリ5.3%(DCE)が提案されている。
CPGは、各カテゴリを複数のプロトタイプで表現することで、カテゴリ内の多様性を完全にキャプチャすることを可能にする。
DCEは生成されたカテゴリプロトタイプのガイダンスによってハッシュコードの識別能力を向上する。
論文 参考訳(メタデータ) (2024-10-24T23:51:40Z) - Data-free Knowledge Distillation for Fine-grained Visual Categorization [9.969720644789781]
本稿では,DFKDを細粒度視覚分類(FGVC)タスクに拡張するDFKD-FGVCという手法を提案する。
本研究では,広く使用されている3つのFGVCベンチマーク(Aircraft,Cars196,CUB200)に対するアプローチを評価し,その性能を実証した。
論文 参考訳(メタデータ) (2024-04-18T09:44:56Z) - Boosting Few-Shot Learning via Attentive Feature Regularization [35.4031662352264]
多様体正規化に基づくFSL(Few-shot Learning)は,限られたトレーニングサンプルを用いた新規物体の認識能力の向上を目的としている。
本稿では,特徴適応性と識別性の向上を目的とした特徴正規化(AFR)を提案する。
論文 参考訳(メタデータ) (2024-03-23T14:36:48Z) - Revisiting Foreground and Background Separation in Weakly-supervised
Temporal Action Localization: A Clustering-based Approach [48.684550829098534]
弱教師付き時間的アクションローカライゼーションは、アクションインスタンスをビデオレベルのアクションラベルのみでローカライズすることを目的としている。
クラスタリングに基づく新しいF&B分離アルゴリズムを提案する。
我々は,THUMOS14,ActivityNet v1.2,v1.3の3つのベンチマークで評価を行った。
論文 参考訳(メタデータ) (2023-12-21T18:57:12Z) - Dynamic Clustering and Cluster Contrastive Learning for Unsupervised
Person Re-identification [29.167783500369442]
教師なしRe-ID手法は、ラベルのないデータから堅牢で差別的な特徴を学習することを目的としている。
本稿では,動的クラスタリングとクラスタコントラスト学習(DCCC)手法を提案する。
提案したDCCCの有効性を検証するために, 広く利用されている複数の公開データセットの実験を行った。
論文 参考訳(メタデータ) (2023-03-13T01:56:53Z) - Weakly Supervised Video Anomaly Detection Based on Cross-Batch
Clustering Guidance [39.43891080713327]
ビデオレベルのラベルのみをトレーニングできるため、弱教師付きビデオ異常検出(WSVAD)は難しい課題である。
本稿では,クロスバッチクラスタリングガイダンスに基づく新しいWSVAD手法を提案する。
論文 参考訳(メタデータ) (2022-12-16T14:38:30Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。