論文の概要: Diffusion Domain Expansion: Learning to Coordinate Pre-trained Diffusion Models
- arxiv url: http://arxiv.org/abs/2605.23275v1
- Date: Fri, 22 May 2026 06:29:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.22561
- Title: Diffusion Domain Expansion: Learning to Coordinate Pre-trained Diffusion Models
- Title(参考訳): 拡散領域拡大:事前学習された拡散モデルの調整を学ぶ
- Authors: Egor Lifar, Semyon Savkin, Timur Garipov, Shangyuan Tong, Tommi Jaakkola,
- Abstract要約: Diffusion Domain Expansion (DDE) は、事前学習した拡散モデルを効率的に拡張し、より大きなオブジェクトを生成する手法である。
本手法では,事前学習した拡散モデルの離散化出力を調整するために,コンパクトなトレーニング可能なネットワークを用いる。
- 参考スコア(独自算出の注目度): 5.498731672887391
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose Diffusion Domain Expansion (DDE), a method that efficiently extends pre-trained diffusion models to generate larger objects and handle more complex conditioning beyond their original capabilities. Our method employs a compact trainable network designed to coordinate the denoised outputs of pre-trained diffusion models. We demonstrate that the coordinator can be universally simple while being capable of generalizing to domains larger than those observed during its training time. We evaluate DDE on long audio track generation and conditional image generation, demonstrating its applicability across domains. DDE outperforms other approaches to coordinated generation with diffusion models in qualitative and quantitative evaluations.
- Abstract(参考訳): 本稿では,DDE(Diffusion Domain Expansion)を提案する。DDE(Diffusion Domain Expansion)は,事前学習した拡散モデルを効率的に拡張して,より大きなオブジェクトを生成し,元の能力を超える複雑な条件付けを処理する手法である。
本手法では,事前学習した拡散モデルの離散化出力を調整するために,コンパクトなトレーニング可能なネットワークを用いる。
コーディネータは、トレーニング期間中に観測された領域よりも大きい領域に一般化できる一方で、普遍的に単純であることを示す。
長い音声トラック生成と条件付き画像生成におけるDDEの評価を行い、ドメイン間の適用性を実証した。
DDEは、定性的および定量的評価において拡散モデルとの協調生成に対する他のアプローチよりも優れている。
関連論文リスト
- An Overview of Diffusion Models: Applications, Guided Generation, Statistical Rates and Optimization [59.63880337156392]
拡散モデルはコンピュータビジョン、オーディオ、強化学習、計算生物学において大きな成功を収めた。
経験的成功にもかかわらず、拡散モデルの理論は非常に限定的である。
本稿では,前向きな理論や拡散モデルの手法を刺激する理論的露光について述べる。
論文 参考訳(メタデータ) (2024-04-11T14:07:25Z) - Guided Diffusion from Self-Supervised Diffusion Features [49.78673164423208]
ガイダンスは拡散モデルにおいて重要な概念として機能するが、その効果は追加のデータアノテーションや事前学習の必要性によって制限されることが多い。
本稿では,拡散モデルからガイダンスを抽出するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-14T11:19:11Z) - Diff-Instruct: A Universal Approach for Transferring Knowledge From
Pre-trained Diffusion Models [77.83923746319498]
本稿では,任意の生成モデルの学習を指導するDiff-Instructというフレームワークを提案する。
Diff-Instructは、最先端の単一ステップ拡散モデルであることを示す。
GANモデルの精製実験により、Diff-InstructはGANモデルの事前訓練されたジェネレータを一貫して改善できることが示されている。
論文 参考訳(メタデータ) (2023-05-29T04:22:57Z) - Towards Controllable Diffusion Models via Reward-Guided Exploration [15.857464051475294]
強化学習(RL)による拡散モデルの学習段階を導く新しい枠組みを提案する。
RLは、政策そのものではなく、指数スケールの報酬に比例したペイオフ分布からのサンプルによる政策勾配を計算することができる。
3次元形状と分子生成タスクの実験は、既存の条件拡散モデルよりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-04-14T13:51:26Z) - Unifying Diffusion Models' Latent Space, with Applications to
CycleDiffusion and Guidance [95.12230117950232]
関係領域で独立に訓練された2つの拡散モデルから共通潜時空間が現れることを示す。
テキスト・画像拡散モデルにCycleDiffusionを適用することで、大規模なテキスト・画像拡散モデルがゼロショット画像・画像拡散エディタとして使用できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:53:52Z) - A Survey on Generative Diffusion Model [75.93774014861978]
拡散モデルは、深層生成モデルの新たなクラスである。
時間を要する反復生成過程や高次元ユークリッド空間への閉じ込めなど、いくつかの制限がある。
本調査では,拡散モデルの向上を目的とした高度な手法を多数提示する。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。