論文の概要: Elucidating The Design Space of Classifier-Guided Diffusion Generation
- arxiv url: http://arxiv.org/abs/2310.11311v1
- Date: Tue, 17 Oct 2023 14:34:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 15:31:51.260492
- Title: Elucidating The Design Space of Classifier-Guided Diffusion Generation
- Title(参考訳): 分類器誘導拡散生成の設計空間の解明
- Authors: Jiajun Ma, Tianyang Hu, Wenjia Wang and Jiacheng Sun
- Abstract要約: そこで本研究では,市販の分類器をトレーニング不要の手法で活用することにより,既存の指導方式よりも大幅な性能向上を実現することができることを示す。
提案手法は大きな可能性を秘めており,テキスト・画像生成タスクに容易にスケールアップできる。
- 参考スコア(独自算出の注目度): 17.704873767509557
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Guidance in conditional diffusion generation is of great importance for
sample quality and controllability. However, existing guidance schemes are to
be desired. On one hand, mainstream methods such as classifier guidance and
classifier-free guidance both require extra training with labeled data, which
is time-consuming and unable to adapt to new conditions. On the other hand,
training-free methods such as universal guidance, though more flexible, have
yet to demonstrate comparable performance. In this work, through a
comprehensive investigation into the design space, we show that it is possible
to achieve significant performance improvements over existing guidance schemes
by leveraging off-the-shelf classifiers in a training-free fashion, enjoying
the best of both worlds. Employing calibration as a general guideline, we
propose several pre-conditioning techniques to better exploit pretrained
off-the-shelf classifiers for guiding diffusion generation. Extensive
experiments on ImageNet validate our proposed method, showing that
state-of-the-art diffusion models (DDPM, EDM, DiT) can be further improved (up
to 20%) using off-the-shelf classifiers with barely any extra computational
cost. With the proliferation of publicly available pretrained classifiers, our
proposed approach has great potential and can be readily scaled up to
text-to-image generation tasks. The code is available at
https://github.com/AlexMaOLS/EluCD/tree/main.
- Abstract(参考訳): 条件拡散生成の指導は試料の品質と制御性にとって非常に重要である。
しかし、既存の指導方法が望まれている。
一方、分類器ガイダンスや分類器フリーガイダンスといった主流の手法では、ラベル付きデータによる追加トレーニングが必要であり、新しい条件に適応できない。
一方、ユニバーサルガイダンスのようなトレーニングフリーな手法は柔軟ではあるが、同等のパフォーマンスをまだ示していない。
本研究は,設計空間の包括的調査を通じて,既設の分類器をトレーニングフリーで活用し,両世界のベストを享受することにより,既存の指導方式よりも大幅な性能向上を実現することができることを示す。
キャリブレーションを一般的なガイドラインとして用い,事前学習したオフザシェルフ分類器による拡散誘導手法を提案する。
ImageNetの大規模な実験により提案手法の有効性を検証し,計算コストの少ないオフ・ザ・シェルフ分類器を用いて,最先端拡散モデル (DDPM, EDM, DiT) をさらに改善 (最大20%) できることを示した。
公開事前学習型分類器の普及に伴い,提案手法は大きな可能性を秘めており,テキスト・画像生成タスクにも容易に拡張できる。
コードはhttps://github.com/alexmaols/elucd/tree/mainで入手できる。
関連論文リスト
- Adding Conditional Control to Diffusion Models with Reinforcement Learning [59.295203871547336]
拡散モデルは、生成されたサンプルの特性を正確に制御できる強力な生成モデルである。
本研究では、オフラインデータセットを活用した強化学習(RL)に基づく新しい制御手法を提案する。
論文 参考訳(メタデータ) (2024-06-17T22:00:26Z) - Dreamguider: Improved Training free Diffusion-based Conditional Generation [31.68823843900196]
Dreamguiderは、拡散ネットワークを介して計算量の多いバックプロパゲーションを伴わない推論時ガイダンスを可能にする手法である。
提案するモジュールの有効性を示すために,複数のデータセットやモデルにまたがる複数のタスクに対してDreamguiderを用いて実験を行った。
論文 参考訳(メタデータ) (2024-06-04T17:59:32Z) - Manifold Preserving Guided Diffusion [121.97907811212123]
条件付き画像生成は、コスト、一般化可能性、タスク固有のトレーニングの必要性といった課題に直面している。
トレーニング不要な条件生成フレームワークであるManifold Preserving Guided Diffusion (MPGD)を提案する。
論文 参考訳(メタデータ) (2023-11-28T02:08:06Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Guiding The Last Layer in Federated Learning with Pre-Trained Models [18.382057374270143]
フェデレートラーニング(FL)は、データを共有することなく、多数の参加者にまたがってモデルをトレーニングできる新興パラダイムである。
NCM(Nearest Class Means)を用いた分類ヘッドの適合は,既存の提案よりも正確に,桁違いに効率的に行えることを示す。
論文 参考訳(メタデータ) (2023-06-06T18:02:02Z) - End-to-End Diffusion Latent Optimization Improves Classifier Guidance [81.27364542975235]
拡散潜水剤(DOODL)の直接最適化は,新しいガイダンス手法である。
拡散潜伏剤の最適化によるプラグアンドプレイ誘導を可能にする。
計算と人的評価の指標において、一段階の分類器ガイダンスよりも優れている。
論文 参考訳(メタデータ) (2023-03-23T22:43:52Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。