論文の概要: Synthetic Data Augmentation using Pre-trained Diffusion Models for Long-tailed Food Image Classification
- arxiv url: http://arxiv.org/abs/2506.01368v1
- Date: Mon, 02 Jun 2025 06:51:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.076183
- Title: Synthetic Data Augmentation using Pre-trained Diffusion Models for Long-tailed Food Image Classification
- Title(参考訳): 長期食品画像分類のための事前学習拡散モデルを用いた合成データ拡張
- Authors: GaYeon Koh, Hyun-Jic Oh, Jeonghyun Noh, Won-Ki Jeong,
- Abstract要約: 長期食品分類のための2段階合成データ拡張フレームワークを提案する。
生成対象に対して正のプロンプトで条件付き参照セットを生成し、生成対象と類似した特徴を共有するクラスを負のプロンプトとして選択する。
提案手法の有効性を2つの長期食品ベンチマークデータセットに示すとともに,トップ1の精度で過去の研究よりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 3.3659467814492654
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based food image classification enables precise identification of food categories, further facilitating accurate nutritional analysis. However, real-world food images often show a skewed distribution, with some food types being more prevalent than others. This class imbalance can be problematic, causing models to favor the majority (head) classes with overall performance degradation for the less common (tail) classes. Recently, synthetic data augmentation using diffusion-based generative models has emerged as a promising solution to address this issue. By generating high-quality synthetic images, these models can help uniformize the data distribution, potentially improving classification performance. However, existing approaches face challenges: fine-tuning-based methods need a uniformly distributed dataset, while pre-trained model-based approaches often overlook inter-class separation in synthetic data. In this paper, we propose a two-stage synthetic data augmentation framework, leveraging pre-trained diffusion models for long-tailed food classification. We generate a reference set conditioned by a positive prompt on the generation target and then select a class that shares similar features with the generation target as a negative prompt. Subsequently, we generate a synthetic augmentation set using positive and negative prompt conditions by a combined sampling strategy that promotes intra-class diversity and inter-class separation. We demonstrate the efficacy of the proposed method on two long-tailed food benchmark datasets, achieving superior performance compared to previous works in terms of top-1 accuracy.
- Abstract(参考訳): 深層学習に基づく食品画像分類は、食品カテゴリーの正確な識別を可能にし、さらに正確な栄養分析を容易にする。
しかし、現実の食品画像は、しばしば歪んだ分布を示し、一部の食品は、他のものよりも一般的である。
このクラス不均衡は問題になりうるので、モデルは、あまり一般的でない(尾)クラスに対して、全体的なパフォーマンス劣化を伴う多数(先頭)クラスを好まざるを得ない。
近年,拡散型生成モデルを用いた合成データ拡張が,この問題に対処するための有望な解決策として浮上している。
高品質な合成画像を生成することで、これらのモデルはデータの分散を統一し、分類性能を向上させることができる。
しかし、既存のアプローチは課題に直面している: 微調整ベースの手法は均一に分散したデータセットを必要とするが、事前訓練されたモデルベースのアプローチは、合成データのクラス間分離を見落としていることが多い。
本稿では,長期食品分類のための事前学習拡散モデルを活用した2段階合成データ拡張フレームワークを提案する。
生成対象に対して正のプロンプトで条件付き参照セットを生成し、生成対象と類似した特徴を共有するクラスを負のプロンプトとして選択する。
次に、クラス内多様性とクラス間分離を促進する複合サンプリング戦略により、正および負のプロンプト条件を用いた合成拡張セットを生成する。
提案手法の有効性を2つの長期食品ベンチマークデータセットに示すとともに,トップ1の精度で過去の研究よりも優れた性能を示した。
関連論文リスト
- Leveraging Diffusion Models for Synthetic Data Augmentation in Protein Subcellular Localization Classification [0.0]
ラベル一貫性を持つサンプルを生成するために,クラス条件記述拡散確率モデル(DDPM)を実装した。
私たちは、Mix LossとMix Representationという2つのハイブリッドトレーニング戦略を通じて、実際のデータとの統合を検討します。
本研究は, バイオメディカル画像分類に生成増強を取り入れた場合の, 現実的なデータ生成と堅牢な管理の重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-05-28T22:58:50Z) - Synthetic Tabular Data Generation for Imbalanced Classification: The Surprising Effectiveness of an Overlap Class [20.606333546028516]
最先端の深部生成モデルでは, 多数例よりも極めて低品質な少数例が得られている。
本稿では,少数分布と多数分布が重複する領域のクラスを導入することで,二進分類ラベルを三進分類ラベルに変換する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-12-20T08:15:20Z) - Training Class-Imbalanced Diffusion Model Via Overlap Optimization [55.96820607533968]
実世界のデータセットで訓練された拡散モデルは、尾クラスの忠実度が劣ることが多い。
拡散モデルを含む深い生成モデルは、豊富な訓練画像を持つクラスに偏りがある。
本研究では,異なるクラスに対する合成画像の分布の重複を最小限に抑えるために,コントラスト学習に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-02-16T16:47:21Z) - Class-Balancing Diffusion Models [57.38599989220613]
クラスバランシング拡散モデル(CBDM)は、分散調整正規化器をソリューションとして訓練する。
提案手法は,CIFAR100/CIFAR100LTデータセットで生成結果をベンチマークし,下流認識タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-30T20:00:14Z) - Your Diffusion Model is Secretly a Zero-Shot Classifier [90.40799216880342]
大規模テキスト・画像拡散モデルからの密度推定をゼロショット分類に活用できることを示す。
分類に対する我々の生成的アプローチは、様々なベンチマークで強い結果が得られる。
我々の結果は、下流タスクにおける差別的モデルよりも生成的な利用に向けての一歩である。
論文 参考訳(メタデータ) (2023-03-28T17:59:56Z) - Diffusing Gaussian Mixtures for Generating Categorical Data [21.43283907118157]
本稿では,高品質なサンプル生成に着目した拡散モデルに基づく分類データの生成モデルを提案する。
評価手法は、分類データを生成するための異なる生成モデルの能力と限界を強調した。
論文 参考訳(メタデータ) (2023-03-08T14:55:32Z) - A Relational Model for One-Shot Classification [80.77724423309184]
インダクティブバイアスを組み込んだディープラーニングモデルは,広範なデータ拡張に頼ることなく,サンプル効率のよい学習にメリットをもたらすことを示す。
提案するワンショット分類モデルは,一対の入力を局所的および対的注意の形で関係マッチングする。
論文 参考訳(メタデータ) (2021-11-08T07:53:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。