論文の概要: Representation-Conditioned Diffusion Models for Guided Training Data Generation
- arxiv url: http://arxiv.org/abs/2605.27495v1
- Date: Tue, 26 May 2026 17:32:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.379037
- Title: Representation-Conditioned Diffusion Models for Guided Training Data Generation
- Title(参考訳): 指導的学習データ生成のための表現条件付き拡散モデル
- Authors: Nithesh Chandher Karthikeyan, Jonas Unger, Gabriel Eilertsen,
- Abstract要約: 生成深層学習により生成した合成画像データセットに基づいて学習したモデルの分類性能を評価する。
我々は,DINOv2,DINOv3,CLIPの学習表現を条件とした潜時拡散モデルを用いた。
この表現条件付き定式化は,クラス条件付き生成を大きなマージンで大幅に上回ることを示す。
- 参考スコア(独自算出の注目度): 1.9517610560768623
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data availability remains a critical bottleneck in many deep learning applications. Large-scale datasets are often expensive to collect, curate and annotate, which can limit the scalability and applicability of supervised learning methods. In this work, we evaluate the classification performance of models trained on synthetic image datasets produced by generative deep learning. In particular, we use latent diffusion models conditioned on learned representations from DINOv2, DINOv3, and CLIP. Our results demonstrates that this representation-conditioned formulation significantly outperforms class-conditioned generation by a large margin (+10.76 p.p. top-1 accuracy on ImageNet100), by improving sample quality and mode coverage. Furthermore, by scaling the size of the synthetic dataset, we are able to outperform a classifier trained on the real data (+2.0 p.p top-1 accuracy). We also demonstrate how generated images can be used for augmentation purposes, outperforming classical augmentation methods, and how the conditioning space can be used for sample filtering to further improve training value. Collectively, these findings highlight that representation-conditioned diffusion models provide a promising approach for augmenting, complementing, or potentially replacing real-world datasets in large-scale visual learning tasks.
- Abstract(参考訳): 多くのディープラーニングアプリケーションにおいて、データの可用性は依然として重要なボトルネックです。
大規模なデータセットは、しばしば収集、キュレート、注釈付けに費用がかかるため、教師付き学習手法のスケーラビリティと適用性を制限できる。
本研究では,生成的深層学習により生成した合成画像データセットに基づいて学習したモデルの分類性能を評価する。
特に,DINOv2,DINOv3,CLIPの学習表現に条件付き潜時拡散モデルを用いる。
この表現条件の定式化は、サンプル品質とモードカバレッジを改善することにより、クラス条件の生成を大きなマージン(+10.76 p.p. top-1 accuracy on ImageNet100)で大幅に上回ることを示す。
さらに、合成データセットのサイズを拡大することにより、実データに基づいて訓練された分類器(+2.0 p.p top-1 精度)を上回ります。
また、生成した画像が拡張目的にどのように使用できるか、古典的な拡張方法より優れているか、サンプルフィルタリングにおいて条件付け空間がいかに活用され、トレーニング値がさらに改善されるかを示す。
これらの知見は、表現条件付き拡散モデルが、大規模視覚学習タスクにおける実世界のデータセットを拡張、補完、あるいは置き換えるための有望なアプローチを提供することを、集合的に強調している。
関連論文リスト
- Exploring Training and Inference Scaling Laws in Generative Retrieval [50.82554729023865]
生成検索は、検索を自己回帰生成タスクとして再構成し、大きな言語モデルがクエリから直接ターゲット文書を生成する。
生成的検索におけるトレーニングと推論のスケーリング法則を体系的に検討し,モデルのサイズ,トレーニングデータスケール,推論時間計算が協調的に性能に与える影響について検討した。
論文 参考訳(メタデータ) (2025-03-24T17:59:03Z) - DreamMask: Boosting Open-vocabulary Panoptic Segmentation with Synthetic Data [61.62554324594797]
オープンな語彙設定でトレーニングデータを生成する方法と、実データと合成データの両方でモデルをトレーニングする方法を探索するDreamMaskを提案する。
一般的に、DreamMaskは大規模なトレーニングデータの収集を著しく単純化し、既存のメソッドのプラグイン・アンド・プレイ・エンハンスメントとして機能する。
例えば、COCOで訓練しADE20Kで試験すると、ドリームマスクを装備したモデルは以前の最先端の2.1% mIoUよりも優れていた。
論文 参考訳(メタデータ) (2025-01-03T19:00:00Z) - Feature-to-Image Data Augmentation: Improving Model Feature Extraction with Cluster-Guided Synthetic Samples [4.041834517339835]
本研究ではFICAugを紹介した。FICAugは機能間データ拡張フレームワークである。
構造化された合成サンプルを生成することにより、限られたデータ条件下でのモデル一般化を改善するように設計されている。
実験の結果, FICAugは分類精度を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-09-26T09:51:08Z) - Generative Expansion of Small Datasets: An Expansive Graph Approach [13.053285552524052]
最小限のサンプルから大規模で情報豊富なデータセットを生成する拡張合成モデルを提案する。
自己アテンション層と最適なトランスポートを持つオートエンコーダは、分散一貫性を洗練させる。
結果は同等のパフォーマンスを示し、モデルがトレーニングデータを効果的に増強する可能性を示している。
論文 参考訳(メタデータ) (2024-06-25T02:59:02Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - Diffusion-Based Neural Network Weights Generation [80.89706112736353]
D2NWGは拡散に基づくニューラルネットワーク重み生成技術であり、転送学習のために高性能な重みを効率よく生成する。
本稿では,ニューラルネットワーク重み生成のための遅延拡散パラダイムを再放送するために,生成的ハイパー表現学習を拡張した。
我々のアプローチは大規模言語モデル(LLM)のような大規模アーキテクチャにスケーラブルであり、現在のパラメータ生成技術の限界を克服しています。
論文 参考訳(メタデータ) (2024-02-28T08:34:23Z) - Instance-Conditioned GAN Data Augmentation for Representation Learning [29.36473147430433]
DA_IC-GANは、学習可能なデータ拡張モジュールで、ほとんどの最先端のトレーニングレシピと組み合わせて、棚外で使用することができる。
DA_IC-GAN は最大容量モデルで 1%p から 2%p の精度を向上できることを示す。
また,DA_IC-GANを自己指導型トレーニングレシピと組み合わせることで,いくつかの設定で1%pの精度向上が達成できることを示す。
論文 参考訳(メタデータ) (2023-03-16T22:45:43Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。