論文の概要: TC-Padé: Trajectory-Consistent Padé Approximation for Diffusion Acceleration
- arxiv url: http://arxiv.org/abs/2603.02943v1
- Date: Tue, 03 Mar 2026 12:50:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.796441
- Title: TC-Padé: Trajectory-Consistent Padé Approximation for Diffusion Acceleration
- Title(参考訳): TC-Padé:拡散加速のための軌道整合パデ近似
- Authors: Benlei Cui, Shaoxuan He, Bukun Huang, Zhizeng Ye, Yunyun Sun, Longtao Huang, Hui Xue, Yang Yang, Jingqun Tang, Zhou Zhao, Haiwen Hong,
- Abstract要約: Tray-Consistent Padé近似はテイラー法よりも正確に遷移挙動を捉える。
TC-PadéはFLUX.1-devで2.88倍、Wan2.1で1.72倍、FID、Aesthetic CLIP、V-2.0で高い品質を維持している。
- 参考スコア(独自算出の注目度): 46.613183870351584
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite achieving state-of-the-art generation quality, diffusion models are hindered by the substantial computational burden of their iterative sampling process. While feature caching techniques achieve effective acceleration at higher step counts (e.g., 50 steps), they exhibit critical limitations in the practical low-step regime of 20-30 steps. As the interval between steps increases, polynomial-based extrapolators like TaylorSeer suffer from error accumulation and trajectory drift. Meanwhile, conventional caching strategies often overlook the distinct dynamical properties of different denoising phases. To address these challenges, we propose Trajectory-Consistent Padé approximation, a feature prediction framework grounded in Padé approximation. By modeling feature evolution through rational functions, our approach captures asymptotic and transitional behaviors more accurately than Taylor-based methods. To enable stable and trajectory-consistent sampling under reduced step counts, TC-Padé incorporates (1) adaptive coefficient modulation that leverages historical cached residuals to detect subtle trajectory transitions, and (2) step-aware prediction strategies tailored to the distinct dynamics of early, mid, and late sampling stages. Extensive experiments on DiT-XL/2, FLUX.1-dev, and Wan2.1 across both image and video generation demonstrate the effectiveness of TC-Padé. For instance, TC-Padé achieves 2.88x acceleration on FLUX.1-dev and 1.72x on Wan2.1 while maintaining high quality across FID, CLIP, Aesthetic, and VBench-2.0 metrics, substantially outperforming existing feature caching methods.
- Abstract(参考訳): 最先端の生成品質を達成するにも拘わらず、拡散モデルは反復サンプリングプロセスのかなりの計算負荷によって妨げられる。
特徴キャッシング技術は,高いステップ数(例:50ステップ)で効果的な加速を実現する一方で,20~30ステップの実用的低ステップ体制において重要な限界を示す。
ステップ間の間隔が増加するにつれて、TaylorSeerのような多項式ベースの外挿器はエラーの蓄積と軌道のドリフトに悩まされる。
一方、従来のキャッシング戦略は、異なるデノナイジングフェーズの異なる動的特性を見落としていることが多い。
これらの課題に対処するため, パデ近似を基盤とした特徴予測フレームワークであるトラジェクトリ・コンスタント・パデ近似を提案する。
有理関数による特徴の進化をモデル化することにより、テイラー法よりも漸近的かつ過渡的な振る舞いを正確に捉えることができる。
ステップカウントの削減の下で安定かつトラジェクトリ一貫性のサンプリングを可能にするため、TC-Padéは(1)履歴キャッシュされた残差を利用して微妙なトラジェクトリ遷移を検出する適応係数変調を導入し、(2)早期、中期、後期の異なるサンプリング段階のダイナミクスに合わせたステップ認識予測戦略を組み込んだ。
DiT-XL/2, FLUX.1-dev, Wan2.1の広範にわたる実験により, TC-Padéの有効性が示された。
例えば、T-PadéはFLUX.1-devで2.88倍、Wan2.1で1.72倍の高速化を実現している。
関連論文リスト
- Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。
Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文 参考訳(メタデータ) (2026-02-12T18:58:12Z) - Dual-End Consistency Model [41.982957134224904]
スロー反復サンプリングは拡散モデルとフローベース生成モデルの実践的展開において大きなボトルネックとなる。
本稿では,安定かつ効果的なトレーニングを実現するために,バイタルサブ軌道クラスタを選択するDual-End Consistency Model (DE-CM)を提案する。
提案手法は,ImageNet 256x256データセットの1ステップ生成において,最先端のFIDスコア1.70を達成し,既存のCMベースのワンステップアプローチよりも優れていた。
論文 参考訳(メタデータ) (2026-02-11T11:51:01Z) - FlowConsist: Make Your Flow Consistent with Real Trajectory [99.22869983378062]
現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文 参考訳(メタデータ) (2026-02-06T03:24:23Z) - Temporal Pair Consistency for Variance-Reduced Flow Matching [13.328987133593154]
TPC(Temporal Pair Consistency)は、同じ確率経路に沿ってペア化された時間ステップで速度予測を結合する軽量な分散還元原理である。
フローマッチング内で確立されたTPCは、複数の解像度でCIFAR-10とImageNetのサンプル品質と効率を改善する。
論文 参考訳(メタデータ) (2026-02-04T00:05:21Z) - Unifying Sign and Magnitude for Optimizing Deep Vision Networks via ThermoLion [0.0]
現在のパラダイムは、情報チャネルドリフトパラメータに静的な妥協を課している。
我々は「低次元」探索モデルと「低次元」動的アライメントフレームワークを導入する。
論文 参考訳(メタデータ) (2025-12-01T17:04:17Z) - ETC: training-free diffusion models acceleration with Error-aware Trend Consistency [46.40478218579471]
モデル出力の再利用による拡散過程の促進
これらの手法は傾向を無視し、モデル固有の寛容性に対する誤り制御を欠いている。
拡散軌道の滑らかな連続性を利用するフレームワークであるETC(Error-aware Trend Consistency)を紹介する。
ETCはFLUXよりも2.65倍の加速を実現し、一貫性の劣化は無視できる。
論文 参考訳(メタデータ) (2025-10-28T07:08:09Z) - Transition Models: Rethinking the Generative Learning Objective [68.16330673177207]
有限時間間隔で状態遷移を解析的に定義する連続時間力学方程式を導入する。
これは、任意のステップ遷移に適応する新しい生成パラダイムである遷移モデル(TiM)をもたらす。
TiMは最先端のパフォーマンスを達成し、SD3.5 (8Bパラメータ)やFLUX.1 (12Bパラメータ)といった主要なモデルを超える。
論文 参考訳(メタデータ) (2025-09-04T17:05:59Z) - Adaptive Federated Learning Over the Air [108.62635460744109]
オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。
解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文 参考訳(メタデータ) (2024-03-11T09:10:37Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。