論文の概要: Enhancing Diffusion-based Dataset Distillation via Adversary-Guided Curriculum Sampling
- arxiv url: http://arxiv.org/abs/2508.01264v1
- Date: Sat, 02 Aug 2025 08:48:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.793129
- Title: Enhancing Diffusion-based Dataset Distillation via Adversary-Guided Curriculum Sampling
- Title(参考訳): 逆ガイド型カリキュラムサンプリングによる拡散に基づくデータセット蒸留の促進
- Authors: Lexiao Zou, Gongwei Chen, Yanda Chen, Miao Zhang,
- Abstract要約: Adversary-Guided Curriculum Smpling (ACS) は、蒸留データセットを複数のキュリキュラに分割する。
ACSは、逆損失による拡散サンプリングプロセスをガイドし、サンプル画像に基づいて訓練された判別器に挑戦する。
ACSはImagewoofで4.1%、ImageNet-1kで2.1%の大幅な改善を実現している。
- 参考スコア(独自算出の注目度): 22.21686398518648
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Dataset distillation aims to encapsulate the rich information contained in dataset into a compact distilled dataset but it faces performance degradation as the image-per-class (IPC) setting or image resolution grows larger. Recent advancements demonstrate that integrating diffusion generative models can effectively facilitate the compression of large-scale datasets while maintaining efficiency due to their superiority in matching data distribution and summarizing representative patterns. However, images sampled from diffusion models are always blamed for lack of diversity which may lead to information redundancy when multiple independent sampled images are aggregated as a distilled dataset. To address this issue, we propose Adversary-guided Curriculum Sampling (ACS), which partitions the distilled dataset into multiple curricula. For generating each curriculum, ACS guides diffusion sampling process by an adversarial loss to challenge a discriminator trained on sampled images, thus mitigating information overlap between curricula and fostering a more diverse distilled dataset. Additionally, as the discriminator evolves with the progression of curricula, ACS generates images from simpler to more complex, ensuring efficient and systematic coverage of target data informational spectrum. Extensive experiments demonstrate the effectiveness of ACS, which achieves substantial improvements of 4.1\% on Imagewoof and 2.1\% on ImageNet-1k over the state-of-the-art.
- Abstract(参考訳): データセット蒸留は、データセットに含まれる豊富な情報をコンパクトな蒸留データセットにカプセル化することを目的としている。
近年、拡散生成モデルの統合は、データ分布の整合性や代表パターンの要約性により効率を保ちながら、大規模データセットの圧縮を効果的に促進できることが示されている。
しかし、拡散モデルからサンプリングされた画像は多様性の欠如によって常に非難され、複数の独立したサンプル画像が蒸留データセットとして集約されると、情報の冗長性が生じる可能性がある。
この問題に対処するために、蒸留したデータセットを複数のキュリキュラに分割するAdversary-Guided Curriculum Sampling (ACS)を提案する。
各カリキュラムを生成するために、ACSは、逆損失による拡散サンプリングプロセスをガイドし、サンプル画像に基づいて訓練された判別器に挑戦し、キュリキュラ間の重なり合いを緩和し、より多様な蒸留データセットを育成する。
さらに、判別器がキュリキュラの進行とともに進化するにつれて、ACSはよりシンプルからより複雑な画像を生成し、ターゲットデータ情報スペクトルの効率的かつ体系的なカバレッジを確保する。
大規模な実験では、画像ウーフでは4.1 %、最先端のImageNet-1kでは2.1 %の大幅な改善が達成された。
関連論文リスト
- Label-Consistent Dataset Distillation with Detector-Guided Refinement [9.74050046377107]
本稿では,コンパクトで情報性の高いデータセットを生成するための検出器誘導型データセット蒸留フレームワークを提案する。
提案手法は,高精細度で高精細度の代表画像を合成し,検証セットの最先端性能を実現する。
論文 参考訳(メタデータ) (2025-07-17T12:42:54Z) - Rethinking Image Super-Resolution from Training Data Perspectives [54.28824316574355]
画像超解像(SR)におけるトレーニングデータの効果について検討する。
そこで我々は,自動画像評価パイプラインを提案する。
その結果, (i) 圧縮アーチファクトの少ないデータセット, (ii) 被写体数によって判断される画像内多様性の高いデータセット, (iii) ImageNet や PASS からの大量の画像がSR性能に肯定的な影響を与えることがわかった。
論文 参考訳(メタデータ) (2024-09-01T16:25:04Z) - One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - Auto Cherry-Picker: Learning from High-quality Generative Data Driven by Language [41.40908753726324]
拡散モデルは現実的で多様な画像を生成することができ、データ集約的な知覚タスクのためのデータ可用性を促進する可能性がある。
textbfAuto textbfCherry-textbfPicker (ACP)を提案する。
論文 参考訳(メタデータ) (2024-06-28T17:53:18Z) - ATOM: Attention Mixer for Efficient Dataset Distillation [17.370852204228253]
本研究では,チャネルと空間的注意の混合を用いて,大規模データセットを効率よく抽出するモジュールを提案する。
どちらのタイプの注目も統合することで、ATOMモジュールは様々なコンピュータビジョンデータセットにまたがる優れた性能を示す。
論文 参考訳(メタデータ) (2024-05-02T15:15:01Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - Training on Thin Air: Improve Image Classification with Generated Data [28.96941414724037]
Diffusion Inversionは、画像分類のための多種多様な高品質なトレーニングデータを生成するための、シンプルで効果的な方法である。
提案手法は,元のデータ分布を捕捉し,画像を安定拡散の潜在空間に反転させることにより,データカバレッジを確保する。
生成した画像が元のデータセットに取って代わることに成功した3つの重要なコンポーネントを特定します。
論文 参考訳(メタデータ) (2023-05-24T16:33:02Z) - Multimodal Data Augmentation for Image Captioning using Diffusion Models [12.221685807426264]
本研究では,Stable Diffusionと呼ばれるテキスト・ツー・イメージ・モデルを利用してトレーニングセットを拡張するデータ拡張手法を提案する。
MS COCOデータセットの実験は、いくつかのベンチマーク手法に対する我々のアプローチの利点を実証している。
生成されたデータを意図的にフィルタリングした後、トレーニング効率及び有効性に関するさらなる改善が得られる。
論文 参考訳(メタデータ) (2023-05-03T01:57:33Z) - Semi-Supervised Image Captioning by Adversarially Propagating Labeled
Data [95.0476489266988]
本稿では、画像キャプションモデルの一般化を改善するための、新しいデータ効率半教師付きフレームワークを提案する。
提案手法は,キャプタにペアデータから学習し,段階的に未ペアデータの関連付けを行うよう訓練する。
1)画像ベースと(2)高密度領域ベースキャプションデータセットの両方を総合的かつ包括的な実験結果とし,それに続いて,少ないペアリングデータセットの包括的分析を行った。
論文 参考訳(メタデータ) (2023-01-26T15:25:43Z) - Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。
深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。
本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文 参考訳(メタデータ) (2022-06-06T13:28:15Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。