論文の概要: Attentive CutMix: An Enhanced Data Augmentation Approach for Deep
Learning Based Image Classification
- arxiv url: http://arxiv.org/abs/2003.13048v2
- Date: Sun, 5 Apr 2020 13:35:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 13:50:09.046708
- Title: Attentive CutMix: An Enhanced Data Augmentation Approach for Deep
Learning Based Image Classification
- Title(参考訳): Attentive CutMix: 深層学習に基づく画像分類のための拡張データ拡張アプローチ
- Authors: Devesh Walawalkar, Zhiqiang Shen, Zechun Liu, Marios Savvides
- Abstract要約: そこで我々は,CutMixに基づく自然拡張拡張戦略であるAttentive CutMixを提案する。
各トレーニングイテレーションにおいて、特徴抽出器から中間注意マップに基づいて最も記述性の高い領域を選択する。
提案手法は単純かつ有効であり,実装が容易であり,ベースラインを大幅に向上させることができる。
- 参考スコア(独自算出の注目度): 58.20132466198622
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolutional neural networks (CNN) are capable of learning robust
representation with different regularization methods and activations as
convolutional layers are spatially correlated. Based on this property, a large
variety of regional dropout strategies have been proposed, such as Cutout,
DropBlock, CutMix, etc. These methods aim to promote the network to generalize
better by partially occluding the discriminative parts of objects. However, all
of them perform this operation randomly, without capturing the most important
region(s) within an object. In this paper, we propose Attentive CutMix, a
naturally enhanced augmentation strategy based on CutMix. In each training
iteration, we choose the most descriptive regions based on the intermediate
attention maps from a feature extractor, which enables searching for the most
discriminative parts in an image. Our proposed method is simple yet effective,
easy to implement and can boost the baseline significantly. Extensive
experiments on CIFAR-10/100, ImageNet datasets with various CNN architectures
(in a unified setting) demonstrate the effectiveness of our proposed method,
which consistently outperforms the baseline CutMix and other methods by a
significant margin.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は、異なる正規化手法で堅牢な表現を学習でき、畳み込み層としての活性化は空間的に相関する。
この特性に基づき, カットアウト, ドロップブロック, カットミクスなど, 多様な地域的ドロップアウト戦略が提案されている。
これらの手法は,物体の識別部分の一部を部分的に取り除き,ネットワークの一般化を促進することを目的としている。
しかし、これらすべてがオブジェクト内の最も重要な領域をキャプチャすることなく、ランダムにこの操作を実行する。
本稿では,cutmixに基づく自然に強化された拡張戦略であるattentive cutmixを提案する。
各トレーニングイテレーションにおいて、特徴抽出器から中間注目マップに基づいて最も記述性の高い領域を選択し、画像中の最も識別性の高い部分の探索を可能にする。
提案手法は単純だが,実装が容易で,ベースラインを大幅に向上させることができる。
cifar-10/100の広範な実験により,様々なcnnアーキテクチャを用いたimagenetデータセットが提案手法の有効性を実証した。
関連論文リスト
- NubbleDrop: A Simple Way to Improve Matching Strategy for Prompted One-Shot Segmentation [2.2559617939136505]
マッチング戦略の有効性とロバスト性を高めるための,単純で訓練のない手法を提案する。
中心となる概念は、マッチングプロセス中にランダムに特徴チャネル(0に設定する)をドロップすることである。
この手法は、病理的なヌブルの破棄を模倣し、他の類似性コンピューティングのシナリオにシームレスに適用することができる。
論文 参考訳(メタデータ) (2024-05-19T08:00:38Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Interpretable Small Training Set Image Segmentation Network Originated
from Multi-Grid Variational Model [5.283735137946097]
深層学習法 (DL) が提案され, 画像分割に広く利用されている。
DLメソッドは通常、トレーニングデータとして大量の手動セグメントデータを必要とし、解釈性に乏しい。
本稿では,MSモデルにおける手作り正則項をデータ適応型一般化可学習正則項に置き換える。
論文 参考訳(メタデータ) (2023-06-25T02:34:34Z) - Decoupled Mixup for Generalized Visual Recognition [71.13734761715472]
視覚認識のためのCNNモデルを学習するための新しい「デカップリング・ミクスアップ」手法を提案する。
本手法は,各画像を識別領域と雑音発生領域に分離し,これらの領域を均一に組み合わせてCNNモデルを訓練する。
実験結果から,未知のコンテキストからなるデータに対する本手法の高一般化性能を示す。
論文 参考訳(メタデータ) (2022-10-26T15:21:39Z) - Adaptive Convolutional Dictionary Network for CT Metal Artifact
Reduction [62.691996239590125]
本稿では,金属人工物削減のための適応畳み込み辞書ネットワーク(ACDNet)を提案する。
我々のACDNetは、トレーニングデータを介して、アーティファクトフリーCT画像の事前を自動で学習し、入力されたCT画像ごとに表現カーネルを適応的に調整することができる。
本手法は,モデルに基づく手法の明確な解釈可能性を継承し,学習に基づく手法の強力な表現能力を維持する。
論文 参考訳(メタデータ) (2022-05-16T06:49:36Z) - New SAR target recognition based on YOLO and very deep multi-canonical
correlation analysis [0.1503974529275767]
本稿では,異なるCNN層から有効な特徴を適応的に融合させることにより,SAR画像ターゲット分類のためのロバストな特徴抽出手法を提案する。
MSTARデータセットの実験により,提案手法が最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-10-28T18:10:26Z) - Puzzle Mix: Exploiting Saliency and Local Statistics for Optimal Mixup [19.680580983094323]
Puzzle Mixは、サリエンシ情報と自然事例の基盤となる統計を明示的に活用するための混合手法である。
実験の結果,Puzzle Mixはアートの一般化と対向ロバスト性を実現していることがわかった。
論文 参考訳(メタデータ) (2020-09-15T10:10:23Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Deep Unfolding Network for Image Super-Resolution [159.50726840791697]
本稿では,学習に基づく手法とモデルに基づく手法の両方を活用する,エンドツーエンドのトレーニング可能なアンフォールディングネットワークを提案する。
提案するネットワークは, モデルベース手法の柔軟性を継承し, 一つのモデルを用いて, 異なるスケール要因に対する, 曖昧でノイズの多い画像の超解像化を行う。
論文 参考訳(メタデータ) (2020-03-23T17:55:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。