論文の概要: Accelerating Frequency Domain Diffusion Models with Error-Feedback Event-Driven Caching
- arxiv url: http://arxiv.org/abs/2604.22901v1
- Date: Fri, 24 Apr 2026 13:56:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.04432
- Title: Accelerating Frequency Domain Diffusion Models with Error-Feedback Event-Driven Caching
- Title(参考訳): エラーフィードバックイベント駆動キャッシングによる周波数領域拡散モデルの高速化
- Authors: Dong Liu, Haisheng Wang, Yanxuan Yu,
- Abstract要約: 周波数領域拡散モデルの高速化を目的として,E$2-CRF (Error-Feedback Event-Driven Cumulative Residual Feature cache)を提案する。
本手法は,(1)信号エネルギーが低周波に集中するスペクトルの局在と,(2)有効周波数次元のミラー対称性の2つの構造特性を利用する。
- 参考スコア(独自算出の注目度): 4.641672190044615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models achieve remarkable success in time series generation. However, slow inference limits their practical deployment. We propose E$^2$-CRF (Error-Feedback Event-Driven Cumulative Residual Feature caching) to accelerate frequency domain diffusion models. Our method exploits two structural properties: (1) spectral localization, where signal energy concentrates in low frequencies, and (2) mirror symmetry, which halves the effective frequency dimension. E$^2$-CRF uses a closed-loop error-feedback system that adaptively caches transformer KV features across diffusion steps. We trigger recomputation using event-driven residual dynamics instead of fixed schedules. Our method selectively recomputes high-energy or rapidly-changing tokens while reusing cached features for stable high-frequency components. E$^2$-CRF achieves ~2.2 speedup while maintaining sample quality. We demonstrate effectiveness on 5 datasets. Our caching strategy naturally aligns with the diffusion process's structure-to-detail progression. We include sufficient-condition error and complexity bounds under standard regularity assumptions (Appendix), alongside empirical validation. Our code is available at https://github.com/NoakLiu/FastFourierDiffusion and is also integrated in https://github.com/NoakLiu/FastCache-xDiT.
- Abstract(参考訳): 拡散モデルは時系列生成において顕著な成功を収めた。
しかし、遅い推論は実践的なデプロイメントを制限する。
周波数領域拡散モデルの高速化を目的としたE$^2$-CRF (Error-Feedback Event-Driven Cumulative Residual Feature cache)を提案する。
本手法は,(1)信号エネルギーが低周波に集中するスペクトルの局在と,(2)有効周波数次元のミラー対称性の2つの構造特性を利用する。
E$^2$-CRFは、拡散ステップ間でトランスフォーマーKV機能を適応的にキャッシュするクローズドループエラーフィードバックシステムを使用する。
固定スケジュールの代わりにイベント駆動残差ダイナミクスを用いた再計算をトリガーする。
本手法は, 安定な高周波成分に対して, キャッシュ機能を再利用しながら, 高エネルギーあるいは高速に変化するトークンを選択的に再計算する。
E$^2$-CRFはサンプル品質を維持しながら約2.2スピードアップを達成する。
5つのデータセットで有効性を示す。
我々のキャッシュ戦略は、拡散過程の構造-詳細進行と自然に一致している。
標準的な正則性仮定(Appendix)の下での十分な条件エラーと複雑性境界に加えて、実証的な検証も含んでいます。
私たちのコードはhttps://github.com/NoakLiu/FastFourierDiffusionで利用可能で、https://github.com/NoakLiu/FastCache-xDiTにも統合されています。
関連論文リスト
- ProCache: Constraint-Aware Feature Caching with Selective Computation for Diffusion Transformer Acceleration [14.306565517230775]
Diffusion Transformer (DiTs) は、生成モデリングにおいて最先端のパフォーマンスを達成したが、その高い計算コストは、リアルタイムデプロイメントを妨げている。
既存の手法では,(1) 均一なキャッシング間隔がDiTの非一様時間ダイナミクスと一致しないこと,(2) 過大なキャッシング間隔によるナイーブな機能再利用が重大なエラーの蓄積につながること,の2つの重要な制限が課されている。
ProCacheはトレーニング不要な動的機能キャッシュフレームワークで、2つのコアコンポーネントを介してこれらの問題に対処する。
論文 参考訳(メタデータ) (2025-12-19T07:27:19Z) - FreqCa: Accelerating Diffusion Models via Frequency-Aware Caching [13.999620910665612]
拡散モデルの特徴の異なる周波数帯域は、時間経過によって異なるダイナミクスを示すことを示す。
本稿では、周波数対応キャッシング(FreqCa)を提案し、その類似性に基づいて低周波成分の特徴を直接再利用する。
また、すべてのレイヤの機能の代わりにCRF(Cumulative Residual Feature)をキャッシュすることを提案し、この機能キャッシングのメモリフットプリントを99%削減する。
論文 参考訳(メタデータ) (2025-10-09T17:22:23Z) - ERTACache: Error Rectification and Timesteps Adjustment for Efficient Diffusion [30.897215456167753]
拡散モデルは、本質的に反復的推論プロセスのため、かなりの計算オーバーヘッドに悩まされる。
我々は、両方のエラータイプを共同で修正する原則的なキャッシュフレームワークであるERTACacheを提案する。
ERTACacheは最大2倍の推論スピードアップを実現します。
論文 参考訳(メタデータ) (2025-08-27T10:37:24Z) - FEB-Cache: Frequency-Guided Exposure Bias Reduction for Enhancing Diffusion Transformer Caching [10.760030872557374]
Diffusion Transformer (DiT) は優れた生成機能を備えているが、計算複雑性が高いため大きな課題に直面している。
本稿では,キャッシュが露出バイアスを大幅に増幅し,生成品質が低下することを確認する。
我々は,非露出バイアス拡散プロセスと整合した共同キャッシュ戦略であるFEBキャッシュを導入する。
論文 参考訳(メタデータ) (2025-03-10T09:49:18Z) - CacheQuant: Comprehensively Accelerated Diffusion Models [3.78219736760145]
CacheQuantは、モデルキャッシングと量子化の技術を共同で最適化することで、拡散モデルを包括的に高速化する、新しいトレーニング不要のパラダイムである。
実験の結果、CacheQuantはMS-COCO上の安定拡散のために5.18のスピードアップと4の圧縮を実現しており、CLIPスコアは0.02しか失われていない。
論文 参考訳(メタデータ) (2025-03-03T09:04:51Z) - Learning-to-Cache: Accelerating Diffusion Transformer via Layer Caching [56.286064975443026]
拡散変圧器内の多数の層をキャッシュ機構で計算することで、モデルパラメータを更新しなくても容易に除去できる。
本稿では,拡散変圧器の動的手法でキャッシングを学習するL2C(Learningto-Cache)を提案する。
実験の結果,L2C は DDIM や DPM-r など,キャッシュベースの従来の手法と同等の推論速度で性能を向上することがわかった。
論文 参考訳(メタデータ) (2024-06-03T18:49:57Z) - DeepCache: Accelerating Diffusion Models for Free [65.02607075556742]
DeepCacheは、モデルアーキテクチャの観点から拡散モデルを加速するトレーニング不要のパラダイムである。
DeepCacheは拡散モデルのシーケンシャルなデノナイジングステップで観測される時間的冗長性に乗じている。
同じスループットで、DeepCacheはDDIMやPLMSで、事実上同等または極端に改善された結果を達成する。
論文 参考訳(メタデータ) (2023-12-01T17:01:06Z) - DiffuSeq-v2: Bridging Discrete and Continuous Text Spaces for
Accelerated Seq2Seq Diffusion Models [58.450152413700586]
ガウス空間に基づく離散突然変異を再構成する学習において拡散モデルを容易にする軟吸収状態を導入する。
我々は、サンプリングプロセスの高速化のために、連続空間内で最先端のODEソルバを用いている。
提案手法は, トレーニング収束率を4倍に向上させ, 類似品質のサンプルを800倍高速に生成する。
論文 参考訳(メタデータ) (2023-10-09T15:29:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。