論文の概要: Dual-Rate Diffusion: Accelerating diffusion models with an interleaved heavy-light network
- arxiv url: http://arxiv.org/abs/2605.18190v1
- Date: Mon, 18 May 2026 10:30:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.397609
- Title: Dual-Rate Diffusion: Accelerating diffusion models with an interleaved heavy-light network
- Title(参考訳): Dual-Rate Diffusion: インターリーブ重光ネットワークによる拡散モデルの高速化
- Authors: Grigory Bartosh, David Ruhe, Emiel Hoogeboom, Jonathan Heek, Thomas Mensink, Tim Salimans,
- Abstract要約: デュアルレート拡散(Dual-Rate Diffusion)は、高容量コンテキストエンコーダと軽量デノナイジングモデルの実行をインターリーブすることでサンプリングを高速化する手法である。
ImageNetベンチマークでは、Dual-Rate Diffusionは標準ベースラインのパフォーマンスと一致し、計算コストを2~4ドル削減した。
- 参考スコア(独自算出の注目度): 33.60166262384809
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models achieve state-of-the-art generative performance but suffer from high computational costs during inference due to the repeated evaluation of a heavy neural network. In this work, we propose Dual-Rate Diffusion, a method to accelerate sampling by interleaving the execution of a heavy high-capacity context encoder and a light efficient denoising model. The context encoder is evaluated sparsely to extract high-dimensional features, which are effectively reused by the light denoising model at every step to refine the sample efficiently. This approach significantly accelerates inference without compromising sample quality. On ImageNet benchmarks, Dual-Rate Diffusion matches the performance of standard baselines while reducing computational cost by a factor of $2$-$4$. Furthermore, we demonstrate that our method is compatible with distillation techniques, such as Moment Matching Distillation, enabling further efficiency gains in few-step generation.
- Abstract(参考訳): 拡散モデルは、最先端の生成性能を達成するが、重いニューラルネットワークの繰り返し評価により、推論中に高い計算コストを被る。
本研究では,重大容量コンテクストエンコーダと軽量デノナイズモデルとをインターリーブすることで,サンプリングを高速化するDual-Rate Diffusionを提案する。
文脈エンコーダを疎結合に評価し、高次元の特徴を抽出し、各ステップで光復調モデルにより効果的に再利用し、試料を効率よく精製する。
このアプローチは、サンプルの品質を損なうことなく、推論を著しく加速する。
ImageNetベンチマークでは、Dual-Rate Diffusionは標準ベースラインのパフォーマンスと一致し、計算コストを2~4ドル削減した。
さらに, 本手法は, モーメントマッチング蒸留などの蒸留技術と互換性があり, 数ステップでさらなる効率向上が期待できることを示した。
関連論文リスト
- One-Step Diffusion Model for Image Motion-Deblurring [85.76149042561507]
本稿では,脱臭過程を1段階に短縮する新しいフレームワークである脱臭拡散モデル(OSDD)を提案する。
拡散モデルにおける忠実度損失に対処するために,構造復元を改善する改良された変分オートエンコーダ(eVAE)を導入する。
提案手法は,実測値と非参照値の両方で高い性能を達成する。
論文 参考訳(メタデータ) (2025-03-09T09:39:57Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Distilling Diffusion Models into Conditional GANs [90.76040478677609]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。
E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。
我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文 参考訳(メタデータ) (2024-05-09T17:59:40Z) - The Missing U for Efficient Diffusion Models [3.712196074875643]
拡散確率モデル(Diffusion Probabilistic Models)は、画像合成、ビデオ生成、分子設計などのタスクにおいて、記録破りのパフォーマンスをもたらす。
それらの能力にもかかわらず、その効率、特に逆過程では、収束速度が遅いことと計算コストが高いため、依然として課題である。
本研究では,連続力学系を利用した拡散モデルのための新しいデノナイジングネットワークの設計手法を提案する。
論文 参考訳(メタデータ) (2023-10-31T00:12:14Z) - Single and Few-step Diffusion for Generative Speech Enhancement [18.487296462927034]
拡散モデルは音声強調において有望な結果を示した。
本稿では,2段階の学習手法を用いて,これらの制約に対処する。
提案手法は定常的な性能を保ち,従って拡散ベースラインよりも大きく向上することを示す。
論文 参考訳(メタデータ) (2023-09-18T11:30:58Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。