論文の概要: Motion-Aware Caching for Efficient Autoregressive Video Generation
- arxiv url: http://arxiv.org/abs/2605.01725v1
- Date: Sun, 03 May 2026 05:49:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.905872
- Title: Motion-Aware Caching for Efficient Autoregressive Video Generation
- Title(参考訳): 効率的な自己回帰映像生成のための動き認識キャッシング
- Authors: Jing Xu, Yuexiao Ma, Songwei Liu, Xuzhe Zheng, Shiwei Liu, Chenqian Yan, Xiawu Zheng, Rongrong Ji, Fei Chao, Xing Wang,
- Abstract要約: MotionCacheは、ピクセルレベルのモーション特性の軽量プロキシとして、フレーム間の差異を利用する。
SkyReels-V2やMAGI-1のような最先端モデルの実験では、MotionCacheが大幅なスピードアップを実現している。
- 参考スコア(独自算出の注目度): 73.27762884730272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autoregressive video generation paradigms offer theoretical promise for long video synthesis, yet their practical deployment is hindered by the computational burden of sequential iterative denoising. While cache reuse strategies can accelerate generation by skipping redundant denoising steps, existing methods rely on coarse-grained chunk-level skipping that fails to capture fine-grained pixel dynamics. This oversight is critical: pixels with high motion require more denoising steps to prevent error accumulation, while static pixels tolerate aggressive skipping. We formalize this insight theoretically by linking cache errors to residual instability, and propose MotionCache, a motion-aware cache framework that exploits inter-frame differences as a lightweight proxy for pixel-level motion characteristics. MotionCache employs a coarse-to-fine strategy: an initial warm-up phase establishes semantic coherence, followed by motion-weighted cache reuse that dynamically adjusts update frequencies per token. Extensive experiments on state-of-the-art models like SkyReels-V2 and MAGI-1 demonstrate that MotionCache achieves significant speedups of $\textbf{6.28}\times$ and $\textbf{1.64}\times$ respectively, while effectively preserving generation quality (VBench: $1\%\downarrow$ and $0.01\%\downarrow$ respectively). The code is available at https://github.com/ywlq/MotionCache.
- Abstract(参考訳): 自己回帰ビデオ生成のパラダイムは、長いビデオ合成の理論的な約束を提供するが、それらの実践的な展開は、逐次反復的復調の計算負担によって妨げられる。
キャッシュ再利用戦略は冗長なデノジングステップをスキップすることで生成を加速するが、既存の方法は粗いチャンクレベルのスキップに依存しており、微細なピクセルのダイナミックスをキャプチャできない。
高い動きを持つピクセルは、エラーの蓄積を防ぐためにより多くのデノイングステップを必要とし、静的なピクセルはアグレッシブなスキップを許容する。
我々は、キャッシュエラーと残像の不安定性をリンクすることで理論的にこの知見を定式化し、フレーム間の差を利用したモーション対応キャッシュフレームワークであるMotionCacheを画素レベルの動作特性の軽量プロキシとして提案する。
初期ウォームアップフェーズはセマンティックコヒーレンスを確立し、その後にトークン毎に更新頻度を動的に調整するモーション重み付けキャッシュを再使用する。
SkyReels-V2 や MAGI-1 のような最先端モデルに対する大規模な実験は、MotionCache がそれぞれ$\textbf{6.28}\times$ と $\textbf{1.64}\times$ の大幅なスピードアップを達成し、生成品質を効果的に保ちながら(VBench: $1\%\downarrow$ と $0.01\%\downarrow$ )。
コードはhttps://github.com/ywlq/MotionCacheで入手できる。
関連論文リスト
- X-Cache: Cross-Chunk Block Caching for Few-Step Autoregressive World Models Inference [37.22440439525785]
X-Cacheはトレーニング不要なアクセラレーション手法で、連続的な生成チャンクにまたがってキャッシュする。
Xキャッシュは最小の劣化を保ちながら2.6倍のウォールクロックスピードアップで71%のブロックスキップ速度を達成する。
論文 参考訳(メタデータ) (2026-04-22T07:36:59Z) - WorldCache: Content-Aware Caching for Accelerated Video World Models [50.7543797435026]
我々はPerception-Constrained Dynamic CaCacheフレームワークであるtextbfWorldCacheを紹介する。
WorldCacheは、機能をいつ、どのように再利用するかを改善します。
PAI-Benchで評価されたCosmos-2.5-2Bでは、WorldCacheはtextbf$2.3times$推論スピードアップを実現し、textbf99.4%のベースライン品質を維持している。
論文 参考訳(メタデータ) (2026-03-23T17:59:54Z) - SenCache: Accelerating Diffusion Model Inference via Sensitivity-Aware Caching [75.02865981328509]
キャッシュは、以前計算されたモデル出力をタイムステップで再利用することで計算を減らす。
本稿では,動的キャッシュポリシーであるSensitivity-Aware Caching(SenCache)を提案する。
SenCacheは、同様の計算予算の下で、既存のキャッシュメソッドよりも視覚的品質が向上する。
論文 参考訳(メタデータ) (2026-02-27T17:36:09Z) - Flow caching for autoregressive video generation [72.10021661412364]
自動回帰ビデオ生成に特化して設計された,最初のキャッシュフレームワークであるFlowCacheを紹介する。
本手法は,MAGI-1では2.38倍,SkyReels-V2では6.7倍,品質劣化は無視できない。
論文 参考訳(メタデータ) (2026-02-11T13:11:04Z) - TaoCache: Structure-Maintained Video Generation Acceleration [4.594224594572109]
ビデオ拡散モデルのためのトレーニング不要のプラグイン・アンド・プレイキャッシュ戦略であるTaoCacheを提案する。
モデルのノイズ出力を予測するために固定点視点を採用しており、特に遅延雑音発生の段階で有効である。
論文 参考訳(メタデータ) (2025-08-12T14:40:36Z) - Less is Enough: Training-Free Video Diffusion Acceleration via Runtime-Adaptive Caching [57.7533917467934]
EasyCacheは、ビデオ拡散モデルのためのトレーニング不要のアクセラレーションフレームワークである。
我々は,OpenSora,Wan2.1,HunyuanVideoなどの大規模ビデオ生成モデルについて包括的な研究を行っている。
提案手法は,従来のベースラインと比較して推定時間を最大2.1-3.3$times$に短縮する。
論文 参考訳(メタデータ) (2025-07-03T17:59:54Z) - DeepCache: Accelerating Diffusion Models for Free [65.02607075556742]
DeepCacheは、モデルアーキテクチャの観点から拡散モデルを加速するトレーニング不要のパラダイムである。
DeepCacheは拡散モデルのシーケンシャルなデノナイジングステップで観測される時間的冗長性に乗じている。
同じスループットで、DeepCacheはDDIMやPLMSで、事実上同等または極端に改善された結果を達成する。
論文 参考訳(メタデータ) (2023-12-01T17:01:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。