論文の概要: DRiffusion: Draft-and-Refine Process Parallelizes Diffusion Models with Ease
- arxiv url: http://arxiv.org/abs/2603.25872v1
- Date: Thu, 26 Mar 2026 19:58:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.257854
- Title: DRiffusion: Draft-and-Refine Process Parallelizes Diffusion Models with Ease
- Title(参考訳): DRiffusion:Draft-and-Refine Processs Parallelizes Diffusion Models with Ease
- Authors: Runsheng Bai, Chengyu Zhang, Yangdong Deng,
- Abstract要約: DRiffusionは、ドラフト・アンド・リファインプロセスを通じて拡散推論を並列化する並列サンプリングフレームワークである。
実証的には、DRiffusionは1.4$times$-3.7$times$speedupを複数の拡散モデルで達成し、生成品質は最小限に低下する。
- 参考スコア(独自算出の注目度): 3.5025591191253933
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have achieved remarkable success in generating high-fidelity content but suffer from slow, iterative sampling, resulting in high latency that limits their use in interactive applications. We introduce DRiffusion, a parallel sampling framework that parallelizes diffusion inference through a draft-and-refine process. DRiffusion employs skip transitions to generate multiple draft states for future timesteps and computes their corresponding noises in parallel, which are then used in the standard denoising process to produce refined results. Theoretically, our method achieves an acceleration rate of $\tfrac{1}{n}$ or $\tfrac{2}{n+1}$, depending on whether the conservative or aggressive mode is used, where $n$ denotes the number of devices. Empirically, DRiffusion attains 1.4$\times$-3.7$\times$ speedup across multiple diffusion models while incur minimal degradation in generation quality: on MS-COCO dataset, both FID and CLIP remain largely on par with those of the original model, while PickScore and HPSv2.1 show only minor average drops of 0.17 and 0.43, respectively. These results verify that DRiffusion delivers substantial acceleration and preserves perceptual quality.
- Abstract(参考訳): 拡散モデルは高忠実度コンテンツの生成において顕著な成功を収めているが、遅い反復サンプリングに苦しむため、対話型アプリケーションでは使用が制限される。
DRiffusionは、ドラフト・アンド・リファインプロセスを通じて拡散推論を並列化する並列サンプリングフレームワークである。
DRiffusionは、将来のタイムステップのために複数のドラフト状態を生成するためにスキップ遷移を使用し、対応するノイズを並列に計算し、その後、標準的なデノナイジングプロセスで洗練された結果を生成するために使用される。
理論的には、この手法は、保守的モードか攻撃的モードかによって、$n$がデバイス数を表す場合、$\tfrac{1}{n}$または$\tfrac{2}{n+1}$の加速率を達成する。
実験的にDRiffusionは1.4$\times$-3.7$\times$ Speedupを複数の拡散モデルで達成し、生成品質は最小限に抑えられる: MS-COCOデータセットでは、FIDとCLIPはどちらも元のモデルと大差ないが、PickScoreとHPSv2.1はそれぞれ0.17と0.43の小さな平均降下しか示していない。
これらの結果は、DRiffusionがかなりの加速をもたらし、知覚的品質を維持することを検証する。
関連論文リスト
- Accelerating Diffusion via Hybrid Data-Pipeline Parallelism Based on Conditional Guidance Scheduling [10.012655130147413]
拡散モデルは高忠実度画像、ビデオ、オーディオ生成において顕著な進歩を遂げた。
本フレームワークは,SDXLとSD3でそれぞれ2.31times$と2.07times$のレイテンシ低減を実現している。
提案手法は,高分解能合成条件下での既存の高速化手法よりも優れている。
論文 参考訳(メタデータ) (2026-02-25T10:23:07Z) - FlashDLM: Accelerating Diffusion Language Model Inference via Efficient KV Caching and Guided Diffusion [22.207275433870937]
拡散言語モデルは並列トークン生成と本質的に双方向性を提供する。
最先端拡散モデル(ドリーム7B、LLaDA 8Bなど)は推論が遅い。
我々は,トークンアンマキングを監督するために,軽量な事前学習型自己回帰モデルを用いた学習自由度法であるガイドド拡散を導入する。
論文 参考訳(メタデータ) (2025-05-27T17:39:39Z) - Self-Refining Diffusion Samplers: Enabling Parallelization via Parareal Iterations [53.180374639531145]
自己精製拡散サンプリング(SRDS)は、サンプル品質を維持し、追加の並列計算コストでレイテンシを向上させることができる。
微分方程式の並列時間積分法であるPararealアルゴリズムから着想を得た。
論文 参考訳(メタデータ) (2024-12-11T11:08:09Z) - $\textit{Jump Your Steps}$: Optimizing Sampling Schedule of Discrete Diffusion Models [16.738569359216438]
我々は、余分な計算コストを伴わずにCDEを最小化することにより、離散サンプリングタイムステップの割り当てを最適化する新しいアプローチである、textitJump Your Steps$(JYS)を提示する。
画像、音楽、テキスト生成に関する実験では、JYSはサンプリング品質を大幅に改善する。
論文 参考訳(メタデータ) (2024-10-10T09:44:25Z) - DiffuSeq-v2: Bridging Discrete and Continuous Text Spaces for
Accelerated Seq2Seq Diffusion Models [58.450152413700586]
ガウス空間に基づく離散突然変異を再構成する学習において拡散モデルを容易にする軟吸収状態を導入する。
我々は、サンプリングプロセスの高速化のために、連続空間内で最先端のODEソルバを用いている。
提案手法は, トレーニング収束率を4倍に向上させ, 類似品質のサンプルを800倍高速に生成する。
論文 参考訳(メタデータ) (2023-10-09T15:29:10Z) - Fast Diffusion Model [122.36693015093041]
拡散モデル(DM)は、複雑なデータ分布を捉える能力を持つ様々な分野に採用されている。
本稿では,DM最適化の観点から,高速拡散モデル (FDM) を提案する。
論文 参考訳(メタデータ) (2023-06-12T09:38:04Z) - Parallel Sampling of Diffusion Models [76.3124029406809]
拡散モデルは強力な生成モデルであるが、サンプリングが遅い。
そこで本研究では,複数のステップを並列にdenoisingすることで,事前学習した拡散モデルのサンプリングを高速化するParaDiGMSを提案する。
論文 参考訳(メタデータ) (2023-05-25T17:59:42Z) - Subspace Diffusion Generative Models [4.310834990284412]
スコアベースモデルは、高次元拡散過程を通じて、ノイズをデータにマッピングすることでサンプルを生成する。
データ分布がノイズに向かって進化するにつれて、射影による部分空間への拡散を制限する。
私たちのフレームワークは継続的拡散と完全に互換性があり、柔軟性を維持しています。
論文 参考訳(メタデータ) (2022-05-03T13:43:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。