論文の概要: Cross-Resolution Distribution Matching for Diffusion Distillation
- arxiv url: http://arxiv.org/abs/2603.06136v1
- Date: Fri, 06 Mar 2026 10:45:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.516427
- Title: Cross-Resolution Distribution Matching for Diffusion Distillation
- Title(参考訳): 拡散蒸留におけるクロスリゾリューション分布マッチング
- Authors: Feiyang Chen, Hongpeng Pan, Haonan Xu, Xinyu Duan, Yang Yang, Zhefeng Wang,
- Abstract要約: クロスリゾリューション分布マッチング蒸留は新しい蒸留フレームワークである。
高忠実で数ステップの多分解能カスケード推論のために、クロスレゾリューション分布ギャップを橋渡しする。
SDXLでは最大33.4倍、Wan2.1-14Bでは25.6倍のスピードアップを実現し、高視力を維持している。
- 参考スコア(独自算出の注目度): 16.34026950457199
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Diffusion distillation is central to accelerating image and video generation, yet existing methods are fundamentally limited by the denoising process, where step reduction has largely saturated. Partial timestep low-resolution generation can further accelerate inference, but it suffers noticeable quality degradation due to cross-resolution distribution gaps. We propose Cross-Resolution Distribution Matching Distillation (RMD), a novel distillation framework that bridges cross-resolution distribution gaps for high-fidelity, few-step multi-resolution cascaded inference. Specifically, RMD divides the timestep intervals for each resolution using logarithmic signal-to-noise ratio (logSNR) curves, and introduces logSNR-based mapping to compensate for resolution-induced shifts. Distribution matching is conducted along resolution trajectories to reduce the gap between low-resolution generator distributions and the teacher's high-resolution distribution. In addition, a predicted-noise re-injection mechanism is incorporated during upsampling to stabilize training and improve synthesis quality. Quantitative and qualitative results show that RMD preserves high-fidelity generation while accelerating inference across various backbones. Notably, RMD achieves up to 33.4X speedup on SDXL and 25.6X on Wan2.1-14B, while preserving high visual fidelity.
- Abstract(参考訳): 拡散蒸留は画像生成とビデオ生成の加速の中心であるが, 既存の手法は, ステップ還元がほぼ飽和しているデノナイジング法によって基本的に制限されている。
部分時間ステップの低分解能生成は推論をさらに加速させるが、クロス分解能分布ギャップによる顕著な品質劣化を被る。
本稿では, クロスレゾリューション分散マッチング蒸留(RMD)を提案し, クロスレゾリューション分散ギャップを高忠実で数ステップの多分解能カスケード推論のために橋渡しする新しい蒸留フレームワークを提案する。
具体的には、対数信号-雑音比(logSNR)曲線を用いて各分解能の時間間隔を分割し、分解能誘起シフトを補償するlogSNRマッピングを導入する。
低分解能発生器分布と教師の高分解能分布とのギャップを低減するために, 分解能軌道に沿って分布マッチングを行う。
また、アップサンプリング中に予測ノイズ再注入機構を導入し、トレーニングを安定させ、合成品質を向上させる。
定量的および定性的な結果から、RMDは様々なバックボーンをまたいだ推論を加速しながら高忠実度の発生を保っていることが示された。
特に、RMDはSDXLで最大33.4倍、Wan2.1-14Bで25.6倍のスピードアップを達成する。
関連論文リスト
- Adversarial Distribution Matching for Diffusion Distillation Towards Efficient Image and Video Synthesis [65.77083310980896]
本稿では, 実測値と偽測値の間に潜時予測を整列させる適応分布マッチング (ADM) を提案する。
提案手法は,DMD2と比較してSDXLの1ステップ性能に優れ,GPU時間が少ない。
SD3-Medium, SD3.5-Large, CogVideoX に多段階の ADM 蒸留を適用した実験では, 画像と映像の効率的な合成に向けた新しいベンチマークが設定された。
論文 参考訳(メタデータ) (2025-07-24T16:45:05Z) - Diffusion Models for Solving Inverse Problems via Posterior Sampling with Piecewise Guidance [52.705112811734566]
断片的なガイダンススキームを用いて,逆問題を解決するための新しい拡散型フレームワークが導入された。
提案手法は問題に依存しず,様々な逆問題に容易に適応できる。
このフレームワークは, (4時間), (8時間) の超分解能タスクに対して, (23%), (24%) および (24%) の無作為マスクを塗布する場合の (25%) の推論時間を短縮する。
論文 参考訳(メタデータ) (2025-07-22T19:35:14Z) - Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers [9.875073051988057]
Region-Adaptive Latent Upsampling(ALU)は、空間次元に沿って推論を加速するトレーニング不要のフレームワークである。
1) グローバルセマンティック構造を効率的に捉えるための低分解能遅延拡散の低分解能化、2) 特定の領域に対する領域適応的なアップサンプリング、3) 詳細精細化のために全分解能で遅延アップサンプリングを行う。
FLUXで最大7.0$times$, 安定拡散3で3.0$times$を最小限の劣化で達成することで, 画像品質を保ちながら計算を著しく削減する。
論文 参考訳(メタデータ) (2025-07-11T09:07:43Z) - Single-Step Latent Consistency Model for Remote Sensing Image Super-Resolution [7.920423405957888]
RSISRタスクの効率性と視覚的品質を向上させるために,新しい単一ステップ拡散手法を提案する。
提案したLCMSRは,従来の拡散モデルの反復的なステップを50-1000以上から1ステップに短縮する。
実験の結果, LCMSRは効率と性能のバランスを効果的に保ち, 非拡散モデルに匹敵する推論時間を達成することがわかった。
論文 参考訳(メタデータ) (2025-03-25T09:56:21Z) - One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - Efficient Conditional Diffusion Model with Probability Flow Sampling for Image Super-resolution [35.55094110634178]
画像超解像のための確率フローサンプリングを用いた効率的な条件拡散モデルを提案する。
提案手法は,既存の拡散型画像超解像法よりも高画質化を実現している。
論文 参考訳(メタデータ) (2024-04-16T16:08:59Z) - ResShift: Efficient Diffusion Model for Image Super-resolution by
Residual Shifting [70.83632337581034]
拡散に基づく画像超解像法(SR)は主に低推論速度によって制限される。
本稿では,SRの拡散段数を大幅に削減する新しい,効率的な拡散モデルを提案する。
本手法は,残差をシフトすることで高分解能画像と低分解能画像の間を移動させるマルコフ連鎖を構成する。
論文 参考訳(メタデータ) (2023-07-23T15:10:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。