論文の概要: Data Augmentation for Image Classification using Generative AI
- arxiv url: http://arxiv.org/abs/2409.00547v1
- Date: Sat, 31 Aug 2024 21:16:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 13:55:44.386911
- Title: Data Augmentation for Image Classification using Generative AI
- Title(参考訳): 生成AIを用いた画像分類のためのデータ拡張
- Authors: Fazle Rahat, M Shifat Hossain, Md Rubel Ahmed, Sumit Kumar Jha, Rickard Ewetz,
- Abstract要約: データ拡張はデータセットのサイズを拡大するための有望なソリューションである。
最近のアプローチでは、生成AIモデルを使用してデータセットの多様性を改善している。
我々はAGA(Automated Generative Data Augmentation)を提案する。
- 参考スコア(独自算出の注目度): 8.74488498507946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scaling laws dictate that the performance of AI models is proportional to the amount of available data. Data augmentation is a promising solution to expanding the dataset size. Traditional approaches focused on augmentation using rotation, translation, and resizing. Recent approaches use generative AI models to improve dataset diversity. However, the generative methods struggle with issues such as subject corruption and the introduction of irrelevant artifacts. In this paper, we propose the Automated Generative Data Augmentation (AGA). The framework combines the utility of large language models (LLMs), diffusion models, and segmentation models to augment data. AGA preserves foreground authenticity while ensuring background diversity. Specific contributions include: i) segment and superclass based object extraction, ii) prompt diversity with combinatorial complexity using prompt decomposition, and iii) affine subject manipulation. We evaluate AGA against state-of-the-art (SOTA) techniques on three representative datasets, ImageNet, CUB, and iWildCam. The experimental evaluation demonstrates an accuracy improvement of 15.6% and 23.5% for in and out-of-distribution data compared to baseline models, respectively. There is also a 64.3% improvement in SIC score compared to the baselines.
- Abstract(参考訳): スケーリング法則は、AIモデルのパフォーマンスは利用可能なデータ量に比例する、と規定する。
データ拡張はデータセットのサイズを拡大するための有望なソリューションである。
伝統的なアプローチは、回転、翻訳、縮小による拡張に焦点を当てていた。
最近のアプローチでは、生成AIモデルを使用してデータセットの多様性を改善している。
しかし、生成手法は、被写体腐敗や無関係な人工物の導入といった問題に苦慮している。
本稿では,AGA(Automated Generative Data Augmentation)を提案する。
このフレームワークは、大きな言語モデル(LLM)、拡散モデル、データ拡張のためのセグメンテーションモデルのユーティリティを組み合わせる。
AGAは背景の多様性を確保しつつ、前景の真正性を保っている。
具体的な貢献は以下の通り。
一 セグメント及びスーパークラスに基づく対象抽出
二 即時分解を用いた組合せ複雑性を伴う多様性の促進及び
三 アフィン被写体操作
我々は、画像Net、CUB、iWildCamの3つの代表的なデータセット上で、最先端(SOTA)技術に対してAGAを評価した。
実験による評価では, ベースラインモデルと比較して, 分布内および分布外データの精度が15.6%, 23.5%向上した。
また、SICスコアはベースラインよりも64.3%向上している。
関連論文リスト
- A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Advancing Fine-Grained Classification by Structure and Subject Preserving Augmentation [8.777277201807351]
本報告では,SaSPA: Structure and Subject Preserving Augmentationについて述べる。
本手法では, 実画像をガイダンスとして使用せず, 生成の柔軟性を高め, 多様性を高める。
従来のデータ拡張手法と最近のデータ拡張手法の両方に対して、広範な実験を行い、SaSPAをベンチマークする。
論文 参考訳(メタデータ) (2024-06-20T17:58:30Z) - DreamDA: Generative Data Augmentation with Diffusion Models [68.22440150419003]
本稿では,新しい分類指向フレームワークDreamDAを提案する。
DreamDAは、オリジナルのデータのトレーニングイメージを種として考慮して、オリジナルのデータ分布に準拠する多様なサンプルを生成する。
また、生成したデータのラベルは、対応するシード画像のラベルと一致しない可能性があるため、擬似ラベルを生成するための自己学習パラダイムを導入する。
論文 参考訳(メタデータ) (2024-03-19T15:04:35Z) - Distribution-Aware Data Expansion with Diffusion Models [55.979857976023695]
本研究では,分散型拡散モデルに基づくトレーニングフリーなデータ拡張フレームワークであるDistDiffを提案する。
DistDiffは、オリジナルデータのみにトレーニングされたモデルと比較して、さまざまなデータセットの精度を一貫して向上させる。
論文 参考訳(メタデータ) (2024-03-11T14:07:53Z) - Invariance Learning in Deep Neural Networks with Differentiable Laplace
Approximations [76.82124752950148]
我々はデータ拡張を選択するための便利な勾配法を開発した。
我々はKronecker-factored Laplace近似を我々の目的とする限界確率に近似する。
論文 参考訳(メタデータ) (2022-02-22T02:51:11Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - A Diversity-Enhanced and Constraints-Relaxed Augmentation for
Low-Resource Classification [8.05097035573437]
LRCでは、強い制約があるがDAの弱い多様性は、分類器の能力の一般化を損なう。
DECRA(Diversity-Enhanced and Constraints-Relaxed Augmentation)を提案する。
私たちのDECRAには、トランスベースのバックボーンモデルの上に2つの重要なコンポーネントがあります。
論文 参考訳(メタデータ) (2021-09-24T09:26:29Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。