論文の概要: AdvMask: A Sparse Adversarial Attack Based Data Augmentation Method for
Image Classification
- arxiv url: http://arxiv.org/abs/2211.16040v1
- Date: Tue, 29 Nov 2022 09:25:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 14:51:38.366995
- Title: AdvMask: A Sparse Adversarial Attack Based Data Augmentation Method for
Image Classification
- Title(参考訳): AdvMask:画像分類のためのスパース・アタックに基づくデータ拡張手法
- Authors: Suorong Yang, Jinqiao Li, Jian Zhao, Furao Shen
- Abstract要約: 本稿では,画像分類タスクのための新しいデータ拡張手法AdvMaskを提案する。
画像内の領域をランダムに除去する代わりに、AdvMaskは分類結果に最も大きな影響を与えるキーポイントを取得する。
様々なデータセットおよびCNNモデルによる実験結果から,提案手法が画像分類タスクにおいて,他のデータ拡張手法よりも優れていることを確認した。
- 参考スコア(独自算出の注目度): 8.926478245654703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation is a widely used technique for enhancing the generalization
ability of convolutional neural networks (CNNs) in image classification tasks.
Occlusion is a critical factor that affects on the generalization ability of
image classification models. In order to generate new samples, existing data
augmentation methods based on information deletion simulate occluded samples by
randomly removing some areas in the images. However, those methods cannot
delete areas of the images according to their structural features of the
images. To solve those problems, we propose a novel data augmentation method,
AdvMask, for image classification tasks. Instead of randomly removing areas in
the images, AdvMask obtains the key points that have the greatest influence on
the classification results via an end-to-end sparse adversarial attack module.
Therefore, we can find the most sensitive points of the classification results
without considering the diversity of various image appearance and shapes of the
object of interest. In addition, a data augmentation module is employed to
generate structured masks based on the key points, thus forcing the CNN
classification models to seek other relevant content when the most
discriminative content is hidden. AdvMask can effectively improve the
performance of classification models in the testing process. The experimental
results on various datasets and CNN models verify that the proposed method
outperforms other previous data augmentation methods in image classification
tasks.
- Abstract(参考訳): データ拡張は、画像分類タスクにおける畳み込みニューラルネットワーク(CNN)の一般化能力を高めるために広く用いられているテクニックである。
咬合は画像分類モデルの一般化能力に影響を与える重要な因子である。
新しいサンプルを生成するために、情報削除に基づく既存のデータ拡張手法は、画像内のいくつかの領域をランダムに除去することにより、隠蔽されたサンプルをシミュレートする。
しかし,これらの手法では画像の構造的特徴に応じて画像の領域を削除することはできない。
これらの問題を解決するために,画像分類タスクのための新しいデータ拡張手法AdvMaskを提案する。
画像内の領域をランダムに除去する代わりに、AdvMaskは、エンドツーエンドのスパース攻撃モジュールを通じて分類結果に最も大きな影響を与えるキーポイントを取得する。
したがって,興味対象の様々な画像の外観や形状の多様性を考慮せずに,分類結果の最も敏感な点を見つけることができる。
また、キーポイントに基づいて構造化マスクを生成するためにデータ拡張モジュールを用い、最も識別性の高いコンテンツが隠されている場合に、cnn分類モデルに他の関連コンテンツを求めるよう強制する。
advmaskは、テストプロセスにおける分類モデルのパフォーマンスを効果的に改善できる。
様々なデータセットとCNNモデルによる実験結果から,提案手法が画像分類タスクにおいて,他のデータ拡張手法よりも優れていることを確認した。
関連論文リスト
- On Mask-based Image Set Desensitization with Recognition Support [46.51027529020668]
マスクを用いた画像デセンシタイズ手法を提案する。
我々は,認識タスクの重要な情報を維持するために,解釈アルゴリズムを利用する。
また,マスク画像に基づく性能向上のためのモデル調整手法として,特徴選択マスクネットを提案する。
論文 参考訳(メタデータ) (2023-12-14T14:26:42Z) - High-resolution Image-based Malware Classification using Multiple
Instance Learning [0.0]
本稿では,高解像度グレースケール画像と複数インスタンス学習を用いて,マルウェアを家族に分類する方法を提案する。
この実装はMicrosoft Malware Classificationデータセットで評価され、反対に拡大されたサンプルに対して最大96.6%のアキュラシーを達成している。
論文 参考訳(メタデータ) (2023-11-21T18:11:26Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Improving Masked Autoencoders by Learning Where to Mask [65.89510231743692]
マスケ画像モデリングは視覚データに対する有望な自己教師型学習手法である。
本稿では,Gumbel-Softmax を用いて,対向学習マスク生成装置とマスク誘導画像モデリングプロセスとを相互接続するフレームワーク AutoMAE を提案する。
実験の結果,AutoMAEは,標準の自己監督型ベンチマークや下流タスクに対して,効果的な事前学習モデルを提供することがわかった。
論文 参考訳(メタデータ) (2023-03-12T05:28:55Z) - Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文 参考訳(メタデータ) (2023-02-07T20:42:28Z) - Wild Animal Classifier Using CNN [0.0]
畳み込みニューラルネットワーク(CNN)は、特定の入力を予測するために異なる重みを持つ複数の層を持つ。
画像セグメンテーションは、画像の関心領域の明確な区切りを提供する、そのような広く使われている画像処理手法である。
論文 参考訳(メタデータ) (2022-10-03T13:14:08Z) - Intelligent Masking: Deep Q-Learning for Context Encoding in Medical
Image Analysis [48.02011627390706]
我々は,対象地域を排除し,事前訓練の手順を改善する,新たな自己指導型アプローチを開発した。
予測モデルに対してエージェントを訓練することで、下流の分類タスクで抽出した意味的特徴を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-03-25T19:05:06Z) - Survey: Image Mixing and Deleting for Data Augmentation [0.0]
画像のミキシングと削除は、データ拡張のサブ領域である。
このアプローチでトレーニングされたモデルは、うまく動作し、一般化することが示されている。
計算コストの低減と近年の成功により,画像の混合・削除技術が数多く提案されている。
論文 参考訳(メタデータ) (2021-06-13T20:32:24Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Attention Model Enhanced Network for Classification of Breast Cancer
Image [54.83246945407568]
AMENはマルチブランチ方式で、画素ワイドアテンションモデルとサブモジュールの分類で定式化される。
微妙な詳細情報に焦点を合わせるため、サンプル画像は、前枝から生成された画素対応の注目マップによって強化される。
3つのベンチマークデータセットで行った実験は、様々なシナリオにおいて提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2020-10-07T08:44:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。