論文の概要: Exploring the Equivalence of Closed-Set Generative and Real Data Augmentation in Image Classification
- arxiv url: http://arxiv.org/abs/2508.09550v1
- Date: Wed, 13 Aug 2025 07:14:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.793688
- Title: Exploring the Equivalence of Closed-Set Generative and Real Data Augmentation in Image Classification
- Title(参考訳): 画像分類におけるクローズドセット生成と実データ拡張の等価性の検討
- Authors: Haowen Wang, Guowei Zhang, Xiang Zhang, Zeyuan Chen, Haiyang Xu, Dou Hoon Kwark, Zhuowen Tu,
- Abstract要約: 画像分類タスクのトレーニングセットが与えられた場合、このデータセット上で生成モデルをトレーニングして分類性能を向上させることができるか?
生成モデルにより生成された実画像と閉集合合成画像の区別と類似性について検討する。
拡張に必要な合成画像の等価スケールを実証的に決定する。
- 参考スコア(独自算出の注目度): 39.77627656310901
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address a key scientific problem in machine learning: Given a training set for an image classification task, can we train a generative model on this dataset to enhance the classification performance? (i.e., closed-set generative data augmentation). We start by exploring the distinctions and similarities between real images and closed-set synthetic images generated by advanced generative models. Through extensive experiments, we offer systematic insights into the effective use of closed-set synthetic data for augmentation. Notably, we empirically determine the equivalent scale of synthetic images needed for augmentation. In addition, we also show quantitative equivalence between the real data augmentation and open-set generative augmentation (generative models trained using data beyond the given training set). While it aligns with the common intuition that real images are generally preferred, our empirical formulation also offers a guideline to quantify the increased scale of synthetic data augmentation required to achieve comparable image classification performance. Our results on natural and medical image datasets further illustrate how this effect varies with the baseline training set size and the amount of synthetic data incorporated.
- Abstract(参考訳): 本稿では、機械学習における重要な科学的問題に対処する:画像分類タスクのトレーニングセットが与えられた場合、このデータセット上で生成モデルをトレーニングして分類性能を向上させることができるか?
(つまり、クローズドセット生成データ拡張)。
まず、先進的な生成モデルにより生成された実画像と閉集合合成画像の区別と類似性について検討する。
広範囲な実験を通じて、我々は、拡張のためのクローズドセット合成データの有効利用に関する体系的な洞察を提供する。
特に,拡張に必要な合成画像の等価スケールを実証的に決定する。
また、実データ拡張と開集合生成拡張(与えられたトレーニングセットを超えるデータを用いて訓練された生成モデル)の定量的な等価性を示す。
実画像が一般的に好まれる一般的な直観と一致するが、我々の経験的定式化は、比較画像分類性能を達成するために必要な合成データ増大量の増大を定量化するためのガイドラインも提供する。
自然画像と医用画像のデータセットを用いて, この効果が, ベースライントレーニングセットのサイズや, 組み込まれた合成データの量によってどのように変化するかを示す。
関連論文リスト
- Unleashing the Potential of Synthetic Images: A Study on Histopathology Image Classification [0.12499537119440242]
病理組織像分類は様々な疾患の正確な同定と診断に重要である。
合成画像は、既存のデータセットを効果的に増強し、最終的に下流の病理組織像分類タスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-09-24T12:02:55Z) - DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Improving the Effectiveness of Deep Generative Data [5.856292656853396]
下流の画像処理タスクのための純粋合成画像のモデルを訓練すると、実際のデータに対するトレーニングに比べ、望ましくない性能低下が生じる。
本稿では,この現象に寄与する要因を記述した新しい分類法を提案し,CIFAR-10データセットを用いて検討する。
本手法は,合成データと合成データの混合による学習と合成データのみの学習において,下流分類タスクのベースラインに優れる。
論文 参考訳(メタデータ) (2023-11-07T12:57:58Z) - Unified Framework for Histopathology Image Augmentation and Classification via Generative Models [6.404713841079193]
本稿では,データ生成とモデルトレーニングの段階を統一プロセスに統合する,革新的な統一フレームワークを提案する。
提案手法では、画像合成と分類の両方を同時に扱うために、純粋視覚変換器(ViT)ベースの条件付き生成適応ネットワーク(cGAN)モデルを用いる。
本実験により,我々の統合合成増強フレームワークは,病理組織像分類モデルの性能を一貫して向上させることが示された。
論文 参考訳(メタデータ) (2022-12-20T03:40:44Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。