論文の概要: Timestep-Aware Block Masking for Efficient Diffusion Model Inference
- arxiv url: http://arxiv.org/abs/2603.19939v1
- Date: Fri, 20 Mar 2026 13:35:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.154778
- Title: Timestep-Aware Block Masking for Efficient Diffusion Model Inference
- Title(参考訳): 効率的な拡散モデル推論のための時間ステップ対応ブロックマスキング
- Authors: Haodong He, Yuan Gao, Weizhong Zhang, Gui-Song Xia,
- Abstract要約: 拡散確率モデル(DPM)は画像生成において大きな成功を収めたが、高い推論遅延に悩まされている。
本稿では,事前学習したDPMの計算グラフを時間単位に最適化する新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 48.764748095994996
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion Probabilistic Models (DPMs) have achieved great success in image generation but suffer from high inference latency due to their iterative denoising nature. Motivated by the evolving feature dynamics across the denoising trajectory, we propose a novel framework to optimize the computational graph of pre-trained DPMs on a per-timestep basis. By learning timestep-specific masks, our method dynamically determines which blocks to execute or bypass through feature reuse at each inference stage. Unlike global optimization methods that incur prohibitive memory costs via full-chain backpropagation, our method optimizes masks for each timestep independently, ensuring a memory-efficient training process. To guide this process, we introduce a timestep-aware loss scaling mechanism that prioritizes feature fidelity during sensitive denoising phases, complemented by a knowledge-guided mask rectification strategy to prune redundant spatial-temporal dependencies. Our approach is architecture-agnostic and demonstrates significant efficiency gains across a broad spectrum of models, including DDPM, LDM, DiT, and PixArt. Experimental results show that by treating the denoising process as a sequence of optimized computational paths, our method achieves a superior balance between sampling speed and generative quality. Our code will be released.
- Abstract(参考訳): Diffusion Probabilistic Models (DPM) は画像生成において大きな成功を収めているが、その反復的なデノイングの性質のために高い推論遅延に悩まされている。
そこで本研究では,事前学習したDPMの計算グラフを時間単位に最適化する新しいフレームワークを提案する。
時間ステップ固有のマスクを学習することにより,提案手法は各推論段階で機能再利用を行うブロックを動的に決定する。
フルチェーンバックプロパゲーションによって禁止メモリコストを発生させるグローバルな最適化手法とは異なり、本手法は各時間ステップごとにマスクを独立に最適化し、メモリ効率のトレーニングプロセスを確実にする。
この過程を導くために、我々は、過度な空間的時間的依存を誘発するための知識誘導マスク修正戦略によって補足された、敏感な認知段階における特徴の忠実度を優先する時間ステップ認識損失スケーリング機構を導入する。
提案手法はアーキテクチャに依存しないため,DDPM, LDM, DiT, PixArtなど,幅広いモデルにおいて高い効率性を示す。
実験結果から, 復調過程を最適化された計算経路の列として扱うことにより, サンプリング速度と生成品質のバランスが良くなることがわかった。
私たちのコードは解放されます。
関連論文リスト
- Causal Autoregressive Diffusion Language Model [70.7353007255797]
CARDは厳密な因果注意マスク内の拡散過程を再構成し、単一の前方通過で密集した1対1の監視を可能にする。
我々の結果は,CARDが並列生成のレイテンシの利点を解放しつつ,ARMレベルのデータ効率を実現することを示す。
論文 参考訳(メタデータ) (2026-01-29T17:38:29Z) - Mixture of Distributions Matters: Dynamic Sparse Attention for Efficient Video Diffusion Transformers [13.366686736005699]
サンプリング不要な動的アテンションフレームワークMOD-DiTを提案する。
2段階のプロセスを通じて、注意パターンの進化を正確にモデル化する。
従来のスパースアテンションアプローチの計算的制限を克服する。
論文 参考訳(メタデータ) (2026-01-14T16:25:39Z) - PnP-Flow: Plug-and-Play Image Restoration with Flow Matching [9.589644878034553]
本稿では,逆画像問題の解法であるPlug-and-Play Flow Matchingを提案する。
我々は,デノイング,スーパーレゾリューション,インペインティングのタスクにおける性能を評価した。
論文 参考訳(メタデータ) (2024-10-03T12:13:56Z) - TMPQ-DM: Joint Timestep Reduction and Quantization Precision Selection for Efficient Diffusion Models [40.5153344875351]
我々はTMPQ-DMを導入し、タイムステップの削減と量子化を共同で最適化し、優れた性能・効率のトレードオフを実現する。
時間段階の削減のために、デノナイジング過程の非一様性に合わせた非一様グルーピングスキームを考案する。
量子化の観点では、最終的な生成性能に対するそれぞれの貢献に基づいて、異なる層に異なるビット幅を割り当てる、きめ細かいレイヤーワイズアプローチを採用する。
論文 参考訳(メタデータ) (2024-04-15T07:51:40Z) - DITTO: Diffusion Inference-Time T-Optimization for Music Generation [49.90109850026932]
Diffusion Inference-Time T-Optimization (DITTO) は、事前訓練されたテキストから音楽への拡散モデルを推論時に制御するためのフレームワークである。
我々は、インペイント、アウトペイント、ループ化、強度、メロディ、音楽構造制御など、驚くほど幅広い音楽生成応用を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:10:10Z) - Towards More Accurate Diffusion Model Acceleration with A Timestep Tuner [112.99126045081046]
数千のデノナイジングステップを用いて画像を生成するために定式化された拡散モデルは通常、遅い推論速度に悩まされる。
最小コストで特定の区間に対してより正確な積分方向を求めるのに役立つtextbftimestep tunerを提案する。
実験により,我々のプラグイン設計を効率的に訓練し,様々な最先端加速度法の推論性能を向上できることが示された。
論文 参考訳(メタデータ) (2023-10-14T02:19:07Z) - Learning to Efficiently Sample from Diffusion Probabilistic Models [49.58748345998702]
Denoising Diffusion Probabilistic Models (DDPM) は、様々な領域にわたる高忠実度サンプルと競合する対数類似度が得られる。
我々は,事前学習したDDPMに対して最適な離散時間スケジュールを求める,正確な動的プログラミングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-07T17:15:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。