論文の概要: An approach based on class activation maps for investigating the effects of data augmentation on neural networks for image classification
- arxiv url: http://arxiv.org/abs/2505.12581v1
- Date: Mon, 19 May 2025 00:03:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.321648
- Title: An approach based on class activation maps for investigating the effects of data augmentation on neural networks for image classification
- Title(参考訳): クラスアクティベーションマップに基づく画像分類のためのニューラルネットワークにおけるデータ拡張の効果の研究
- Authors: Lucas M. Dorneles, Luan Fonseca Garcia, Joel Luís Carbonera,
- Abstract要約: 画像分類タスクでは、訓練されたネットワークの堅牢性を高めるためにデータ拡張戦略を用いるのが一般的である。
この文献は、ニューラルネットワークモデルによって学習されたパターンにデータ拡張手法が与える影響を分析する研究の体系を欠いている。
本研究では,画像分類に適用された畳み込みネットワークにおけるデータ拡張の効果を定量的に分析するための方法論とメトリクスセットを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural networks have become increasingly popular in the last few years as an effective tool for the task of image classification due to the impressive performance they have achieved on this task. In image classification tasks, it is common to use data augmentation strategies to increase the robustness of trained networks to changes in the input images and to avoid overfitting. Although data augmentation is a widely adopted technique, the literature lacks a body of research analyzing the effects data augmentation methods have on the patterns learned by neural network models working on complex datasets. The primary objective of this work is to propose a methodology and set of metrics that may allow a quantitative approach to analyzing the effects of data augmentation in convolutional networks applied to image classification. An important tool used in the proposed approach lies in the concept of class activation maps for said models, which allow us to identify and measure the importance these models assign to each individual pixel in an image when executing the classification task. From these maps, we may then extract metrics over the similarities and differences between maps generated by these models trained on a given dataset with different data augmentation strategies. Experiments made using this methodology suggest that the effects of these data augmentation techniques not only can be analyzed in this way but also allow us to identify different impact profiles over the trained models.
- Abstract(参考訳): ここ数年、ニューラルネットワークは、このタスクで達成した印象的なパフォーマンスのために、画像分類のタスクに有効なツールとして人気が高まっている。
画像分類タスクでは、入力画像の変化に対するトレーニングされたネットワークの堅牢性を高め、過度な適合を避けるために、データ拡張戦略を用いるのが一般的である。
データ拡張は広く採用されているテクニックであるが、複雑なデータセットを扱うニューラルネットワークモデルによって学習されたパターンに、データ拡張手法が与える影響を分析する研究の体系が欠如している。
本研究の主な目的は、画像分類に適用された畳み込みネットワークにおけるデータ拡張の効果を定量的に分析できる方法論とメトリクスセットを提案することである。
提案手法で使用される重要なツールは,そのモデルに対するクラスアクティベーションマップ(class activation map)の概念であり,分類タスクの実行時に画像中の各ピクセルに割り当てられるモデルの重要度を識別し,測定することができる。
これらのマップから、データ拡張戦略の異なるデータセット上でトレーニングされたこれらのモデルによって生成されたマップの類似点と相違点に関するメトリクスを抽出することができる。
この手法を用いた実験により、これらのデータ拡張手法の効果は、この方法で解析できるだけでなく、トレーニングされたモデルに対して異なる影響プロファイルを特定できる可能性が示唆された。
関連論文リスト
- Enhancing Image Classification with Augmentation: Data Augmentation Techniques for Improved Image Classification [0.0]
畳み込みニューラルネットワーク(CNN)は、画像に依存するさまざまな分野の応用を見つけ、ディープラーニングの働きをする。
本研究では,本研究で提案される3つの新しいセットを含む11種類のデータ拡張手法の有効性について検討する。
Caltech-101データセットで最も効果的なものとして、画像拡張技術が提案されている。
論文 参考訳(メタデータ) (2025-02-25T23:03:30Z) - Efficient Visualization of Neural Networks with Generative Models and Adversarial Perturbations [0.0]
本稿では,既存の手法を改良した生成ネットワークによるディープビジュアライゼーション手法を提案する。
我々のモデルは、使用するネットワーク数を減らし、ジェネレータと識別器のみを必要とすることにより、アーキテクチャを単純化する。
我々のモデルは、事前の訓練知識を少なくし、差別者がガイドとして機能する非敵的訓練プロセスを使用する。
論文 参考訳(メタデータ) (2024-09-20T14:59:25Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Additional Look into GAN-based Augmentation for Deep Learning COVID-19
Image Classification [57.1795052451257]
我々は,GANに基づく拡張性能のデータセットサイズ依存性について,小サンプルに着目して検討した。
両方のセットでStyleGAN2-ADAをトレーニングし、生成した画像の品質を検証した後、マルチクラス分類問題における拡張アプローチの1つとしてトレーニングされたGANを使用する。
GANベースの拡張アプローチは、中規模および大規模データセットでは古典的な拡張に匹敵するが、より小さなデータセットでは不十分である。
論文 参考訳(メタデータ) (2024-01-26T08:28:13Z) - Image edge enhancement for effective image classification [7.470763273994321]
ニューラルネットワークの精度とトレーニング速度を両立させるエッジ拡張に基づく手法を提案する。
我々のアプローチは、利用可能なデータセット内の画像からエッジなどの高周波特徴を抽出し、元の画像と融合させることである。
論文 参考訳(メタデータ) (2024-01-13T10:01:34Z) - Combining Image Features and Patient Metadata to Enhance Transfer
Learning [0.0]
画像特徴のみを用いる場合の分類作業における6つの最先端ディープニューラルネットワークの性能と,これらを患者のメタデータと組み合わせた場合の比較を行った。
以上の結果から,この性能向上はディープネットワークの一般的な特性である可能性が示唆され,他の分野での探索が望まれる。
論文 参考訳(メタデータ) (2021-10-08T15:43:31Z) - Explainable Adversarial Attacks in Deep Neural Networks Using Activation
Profiles [69.9674326582747]
本稿では,敵対的事例に基づくニューラルネットワークモデルを検討するためのビジュアルフレームワークを提案する。
これらの要素を観察することで、モデル内の悪用領域を素早く特定できることを示す。
論文 参考訳(メタデータ) (2021-03-18T13:04:21Z) - An analysis of the transfer learning of convolutional neural networks
for artistic images [1.9336815376402716]
巨大な自然画像データセットからのトランスファー学習は、アート分析アプリケーションの中核となっている。
本稿ではまず,ネットワークの内部表現を可視化する手法を用いて,ネットワークが芸術的イメージで何を学んだかを理解するための手がかりを提供する。
特徴空間とパラメータ空間の両方のメトリクスと、最大アクティベーション画像のセットで計算されたメトリクスのおかげで、学習プロセスが導入した変化を定量的に分析する。
論文 参考訳(メタデータ) (2020-11-05T09:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。