論文の概要: Trajectory-Consistent Calibration for Cache-Accelerated Diffusion Models
- arxiv url: http://arxiv.org/abs/2605.24870v1
- Date: Sun, 24 May 2026 05:00:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.486538
- Title: Trajectory-Consistent Calibration for Cache-Accelerated Diffusion Models
- Title(参考訳): キャッシュ加速拡散モデルのためのトラジェクトリ一貫性キャリブレーション
- Authors: Mingyu Liang, Dingkun Xu, Jingwei Xu,
- Abstract要約: 拡散変換器は反復サンプリング中に繰り返しデノイザ評価を必要とする。
キャッシュベースのアクセラレーションは、デノナイジングステップ間で中間表現を再利用することで、このコストを削減する。
有効キャリブレーションは, 再利用による直接ミスマッチと, 早期修正による軌道シフトの両方を考慮すべきである。
- 参考スコア(独自算出の注目度): 4.860920475186558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion Transformers require repeated denoiser evaluations during iterative sampling, making inference computationally expensive. Cache-based acceleration reduces this cost by reusing intermediate representations across denoising steps, but can introduce representation deviations and degrade generation quality. In this paper, we analyze these deviations and show that effective calibration should consider both the direct mismatch caused by reuse and the subsequent trajectory shift induced by earlier corrections. To address this challenge, we propose Trajectory-Consistent Calibration (TCC), a training-free method that calibrates cached representations toward their full-computation counterparts. Specifically, rather than estimating all calibration priors from a single uncorrected cache trajectory, TCC uses an offline iterative procedure so that each prior accounts for the trajectory shift induced by preceding calibrations. Experiments on PixArt-alpha and DiT-XL/2 show that TCC consistently improves FID across representative cache-based acceleration methods while preserving their underlying reuse policies. Notably, in a representative PixArt-alpha cache-acceleration setting based on FORA, TCC reduces FID from 29.83 to 27.35, slightly surpassing the full-computation baseline.
- Abstract(参考訳): 拡散変換器は反復サンプリング中に繰り返しデノイザ評価を必要とするため、推論は計算コストがかかる。
キャッシュベースのアクセラレーションは、デノナイジングステップで中間表現を再利用することで、このコストを削減するが、表現の偏りを導入し、生成品質を劣化させる可能性がある。
本稿では, これらの偏差を解析し, 有効キャリブレーションは, 再利用による直接ミスマッチと, 早期修正による軌道シフトの両方を考慮すべきであることを示す。
この課題に対処するため、我々は、キャッシュされた表現をフル計算対象に向けて校正する訓練不要な方法である、Trjectory-Consistent Calibration (TCC)を提案する。
具体的には、1つの補正されていないキャッシュ軌跡からすべてのキャリブレーション前を推定する代わりに、TCCはオフライン反復手順を使用して、前回のキャリブレーションによって誘導される軌道シフトを各プリミティブが考慮する。
PixArt-alpha と DiT-XL/2 の実験により、TCL は、その基盤となる再利用ポリシーを保ちながら、キャッシュベースの一般的なアクセラレーション手法における FID を一貫して改善することを示した。
特に、forAに基づくPixArt-alphaキャッシュ加速設定では、TCCはFIDを29.83から27.35に減らし、フル計算ベースラインをわずかに上回っている。
関連論文リスト
- Temporal Pair Consistency for Variance-Reduced Flow Matching [13.328987133593154]
TPC(Temporal Pair Consistency)は、同じ確率経路に沿ってペア化された時間ステップで速度予測を結合する軽量な分散還元原理である。
フローマッチング内で確立されたTPCは、複数の解像度でCIFAR-10とImageNetのサンプル品質と効率を改善する。
論文 参考訳(メタデータ) (2026-02-04T00:05:21Z) - OUSAC: Optimized Guidance Scheduling with Adaptive Caching for DiT Acceleration [4.771742494878726]
OUSACは分散トランスフォーマー(DiT)をシステム最適化により高速化するフレームワークである。
我々の重要な洞察は、可変誘導スケールがスパース計算を可能にすることである。
Stage-1では、どのタイムステップをスキップするか、どのガイダンススケールを使うかを共同で最適化するために進化的アルゴリズムを採用している。
ステージ2では、変圧器ブロックごとの校正作業を調整するアダプティブなランクアロケーションが導入されている。
論文 参考訳(メタデータ) (2025-12-16T05:11:54Z) - CAGE: Curvature-Aware Gradient Estimation For Accurate Quantization-Aware Training [73.46600457802693]
本稿では,量子化による損失に対応する新しい手法を提案する。
CAGEは、同様の計算コストで、精度の観点から最先端の手法を大幅に改善する。
LlamaモデルのQAT事前トレーニングでは、CAGEは4ビット(W4A4)で達成された精度と事前のベストメソッドとを一致させる。
論文 参考訳(メタデータ) (2025-10-21T16:33:57Z) - Predictive Feature Caching for Training-free Acceleration of Molecular Geometry Generation [67.20779609022108]
フローマッチングモデルは、高忠実度分子ジオメトリを生成するが、推論中にかなりの計算コストを発生させる。
本研究は,分子幾何生成を加速する学習自由キャッシング戦略について論じる。
GEOM-Drugsデータセットの実験は、キャッシングがウォールクロックの推測時間の2倍の削減を実現することを示した。
論文 参考訳(メタデータ) (2025-10-06T09:49:14Z) - Accelerating Diffusion Transformer via Increment-Calibrated Caching with Channel-Aware Singular Value Decomposition [4.0594792247165]
拡散変換器(DiT)モデルは画像生成において顕著な成功を収めた。
Increment-calibrated cache, a training-free method for DiT accelerate。
本手法は45%以上を除去し,0.06 FID増加のコストでISを12倍に改善する。
論文 参考訳(メタデータ) (2025-05-09T06:56:17Z) - Accelerating Diffusion Transformer via Gradient-Optimized Cache [18.32157920050325]
時間的特徴再利用を通じて拡散トランスフォーマー(DiT)サンプリングを高速化するための効果的な戦略として機能キャッシングが登場した。
キャッシュされたブロックからのプログレッシブエラーの蓄積は生成品質を著しく低下させるため、これは難しい問題である。
本稿では,2つの重要なイノベーションを生かしたGradient-Perturbationd Cache (GOC)を提案する。
GOCはIS 216.28 (26.3%上)とFID 3.907 (43%下)をベースラインのDiTと比較して達成し、計算コストは同じである。
論文 参考訳(メタデータ) (2025-03-07T05:31:47Z) - Gradient Normalization Provably Benefits Nonconvex SGD under Heavy-Tailed Noise [60.92029979853314]
重み付き雑音下でのグラディエントDescence(SGD)の収束を確実にする上での勾配正規化とクリッピングの役割について検討する。
我々の研究は、重尾雑音下でのSGDの勾配正規化の利点を示す最初の理論的証拠を提供する。
我々は、勾配正規化とクリッピングを取り入れた加速SGD変種を導入し、さらに重み付き雑音下での収束率を高めた。
論文 参考訳(メタデータ) (2024-10-21T22:40:42Z) - Rolling Shutter Correction with Intermediate Distortion Flow Estimation [55.59359977619609]
本稿では,グローバルシャッタ(GS)からRSへの歪み流を直接推定することにより,ローリングシャッタ(RS)歪み画像を補正することを提案する。
既存の手法は通常、RSからGSへの非歪流を用いて補正を行う。
本稿では,歪み流を直接推定し,後方ワープ操作でRS像を補正する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-09T14:40:54Z) - Adaptive Multi-step Refinement Network for Robust Point Cloud Registration [82.64560249066734]
ポイントクラウド登録は、同じシーンの2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では,前ステップからの情報を活用することで,各ステップの登録品質を向上する適応型多段階改良ネットワークを提案する。
本手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークの両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-05T18:59:41Z) - Deep Equilibrium Optical Flow Estimation [80.80992684796566]
最近のSOTA(State-of-the-art)光フローモデルでは、従来のアルゴリズムをエミュレートするために有限ステップの更新操作を使用する。
これらのRNNは大きな計算とメモリオーバーヘッドを課し、そのような安定した推定をモデル化するために直接訓練されていない。
暗黙的層の無限レベル固定点として直接流れを解く手法として,Deep equilibrium Flow estimatorを提案する。
論文 参考訳(メタデータ) (2022-04-18T17:53:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。