論文の概要: Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification
- arxiv url: http://arxiv.org/abs/2106.03432v1
- Date: Mon, 7 Jun 2021 09:03:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 18:01:23.458817
- Title: Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification
- Title(参考訳): channel dropblock: 細粒度視覚分類のための改良正規化法
- Authors: Yifeng Ding, Shuwei Dong, Yujun Tong, Zhanyu Ma, Bo Xiao, and Haibin
Ling
- Abstract要約: 既存のアプローチは主に、識別的部分を見つけるための注意機構や、高度にパラメータ化された特徴を弱教師付きで抽出する特徴符号化アプローチを導入することでこの問題に対処している。
本研究では,CDB(Channel DropBlock)と呼ばれる軽量で効果的な正規化手法を提案する。
- 参考スコア(独自算出の注目度): 58.07257910065007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classifying the sub-categories of an object from the same super-category
(e.g., bird) in a fine-grained visual classification (FGVC) task highly relies
on mining multiple discriminative features. Existing approaches mainly tackle
this problem by introducing attention mechanisms to locate the discriminative
parts or feature encoding approaches to extract the highly parameterized
features in a weakly-supervised fashion. In this work, we propose a lightweight
yet effective regularization method named Channel DropBlock (CDB), in
combination with two alternative correlation metrics, to address this problem.
The key idea is to randomly mask out a group of correlated channels during
training to destruct features from co-adaptations and thus enhance feature
representations. Extensive experiments on three benchmark FGVC datasets show
that CDB effectively improves the performance.
- Abstract(参考訳): オブジェクトのサブカテゴリを同じスーパーカテゴリ(例えば鳥)から細粒度視覚分類(FGVC)タスクで分類することは、複数の識別的特徴のマイニングに大きく依存する。
既存のアプローチでは,識別的部分の同定や特徴エンコード手法の導入により,高パラメータ化特徴を弱教師付きで抽出することで,この問題に主に対処している。
本研究では,この問題を解決するために,チャネルドロップブロック(cdb)と呼ばれる軽量かつ効果的な正規化手法を提案する。
鍵となるアイデアは、トレーニング中に関連チャネルのグループをランダムにマスクして、特徴を共適応から破壊し、特徴表現を強化することである。
3つのベンチマークFGVCデータセットの大規模な実験は、CDBがパフォーマンスを効果的に改善することを示している。
関連論文リスト
- Revisiting Foreground and Background Separation in Weakly-supervised
Temporal Action Localization: A Clustering-based Approach [48.684550829098534]
弱教師付き時間的アクションローカライゼーションは、アクションインスタンスをビデオレベルのアクションラベルのみでローカライズすることを目的としている。
クラスタリングに基づく新しいF&B分離アルゴリズムを提案する。
我々は,THUMOS14,ActivityNet v1.2,v1.3の3つのベンチマークで評価を行った。
論文 参考訳(メタデータ) (2023-12-21T18:57:12Z) - Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised
Visible-Infrared Person ReID [78.3829236947196]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-22T03:27:46Z) - Dynamic Clustering and Cluster Contrastive Learning for Unsupervised
Person Re-identification [29.167783500369442]
教師なしRe-ID手法は、ラベルのないデータから堅牢で差別的な特徴を学習することを目的としている。
本稿では,動的クラスタリングとクラスタコントラスト学習(DCCC)手法を提案する。
提案したDCCCの有効性を検証するために, 広く利用されている複数の公開データセットの実験を行った。
論文 参考訳(メタデータ) (2023-03-13T01:56:53Z) - Weakly Supervised Video Anomaly Detection Based on Cross-Batch
Clustering Guidance [39.43891080713327]
ビデオレベルのラベルのみをトレーニングできるため、弱教師付きビデオ異常検出(WSVAD)は難しい課題である。
本稿では,クロスバッチクラスタリングガイダンスに基づく新しいWSVAD手法を提案する。
論文 参考訳(メタデータ) (2022-12-16T14:38:30Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Uncertainty-aware Clustering for Unsupervised Domain Adaptive Object
Re-identification [123.75412386783904]
最先端のオブジェクトRe-IDアプローチでは、クラスタリングアルゴリズムを採用して、ラベルのないターゲットドメインの擬似ラベルを生成する。
UDAタスクのための不確実性対応クラスタリングフレームワーク(UCF)を提案する。
我々のUCF法は、オブジェクトRe-IDのための複数のUDAタスクにおける最先端のパフォーマンスを一貫して達成する。
論文 参考訳(メタデータ) (2021-08-22T09:57:14Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Image Clustering using an Augmented Generative Adversarial Network and
Information Maximization [9.614694312155798]
本稿では,GAN (Modified Generative Adversarial Network) と補助分類器からなるディープクラスタリングフレームワークを提案する。
提案手法は, CIFAR-10 と CIFAR-100 のクラスタリング手法を著しく上回り, STL10 と MNIST のデータセットと競合する。
論文 参考訳(メタデータ) (2020-11-08T22:20:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。