論文の概要: EverAnimate: Minute-Scale Human Animation via Latent Flow Restoration
- arxiv url: http://arxiv.org/abs/2605.15042v1
- Date: Thu, 14 May 2026 16:36:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.951563
- Title: EverAnimate: Minute-Scale Human Animation via Latent Flow Restoration
- Title(参考訳): EverAnimate: 潜水による人間アニメーション
- Authors: Wuyang Li, Yang Gao, Mariam Hassan, Lan Feng, Wentao Pan, Po-Chien Luan, Alexandre Alahi,
- Abstract要約: 本研究では,長軸アニメーション映像生成のための効率的なポストトレーニング手法であるEverAnimateを提案する。
EverAnimateは、ジェネレーションを永続的な潜在コンテキストメモリにアンカーすることで、ドリフトしたフロートラジェクトリを復元する。
ライトウェイトなLoRAチューニングだけで、EverAnimateは最先端のロングアニメーションメソッドをショート・ホライズンとロング・ホライズンの両方で上回ります。
- 参考スコア(独自算出の注目度): 74.49189147054337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose EverAnimate, an efficient post-training method for long-horizon animated video generation that preserves visual quality and character identity. Long-form animation remains challenging because highly dynamic human motion must be synthesized against relatively static environments, making chunk-based generation prone to accumulated drift: (i) low-level quality drift, such as progressive degradation of static backgrounds, and (ii) high-level semantic drift, such as inconsistent character identity and view-dependent attributes. To address this issue, EverAnimate restores drifted flow trajectories by anchoring generation to a persistent latent context memory, consisting of two complementary mechanisms. (i) Persistent Latent Propagation maintains a context memory across chunks to propagate identity and motion in latent space while mitigating temporal forgetting. (ii) Restorative Flow Matching introduces an implicit restoration objective during sampling through velocity adjustment, improving within-chunk fidelity. With only lightweight LoRA tuning, EverAnimate outperforms state-of-the-art long-animation methods in both short- and long-horizon settings: at 10 seconds, it improves PSNR/SSIM by 8%/7% and reduces LPIPS/FID by 22%/11%; at 90 seconds, the gains increase to 15%/15% and 32%/27%, respectively.
- Abstract(参考訳): 本研究では,視覚的品質とキャラクタのアイデンティティを保った長軸アニメーション映像生成のための効率的なポストトレーニング手法であるEverAnimateを提案する。
長時間のアニメーションは、非常にダイナミックな人間の動きを比較的静的な環境に対して合成する必要があるため、依然として困難なままである。
(i)静的背景の進行劣化などの低レベルの品質漂流
(II)一貫性のないキャラクタ識別やビュー依存属性などの高レベルのセマンティックドリフト。
この問題に対処するため、EverAnimateは2つの相補的なメカニズムからなる永続的な潜在コンテキストメモリに生成をアンカーすることで、漂流した流れの軌跡を復元する。
一 永続潜時伝播は、時間的忘れを緩和しながら、潜時空間におけるアイデンティティと動きを伝播するために、チャンクをまたいだコンテキスト記憶を維持する。
(II) 回復フローマッチングは, 速度調整によるサンプリング中に暗黙の復元目標を導入し, チャンク内忠実度を向上する。
10秒でPSNR/SSIMを8%/7%改善し、LPIPS/FIDを22%/11%削減する。
関連論文リスト
- IM-Animation: An Implicit Motion Representation for Identity-decoupled Character Animation [58.297199313494]
インプシット法は、動画から直接動作の意味をキャプチャするが、動作と外観の絡み合いやアイデンティティの漏洩に悩まされる。
本稿では,フレームごとの動作をコンパクトな1次元モーショントークンに圧縮する新しい暗黙の動作表現を提案する。
本手法では,3段階のトレーニング戦略を用いて,トレーニング効率を高め,高い忠実性を確保する。
論文 参考訳(メタデータ) (2026-02-07T11:17:20Z) - Knot Forcing: Taming Autoregressive Video Diffusion Models for Real-time Infinite Interactive Portrait Animation [16.692450893925148]
リアルタイム・ポートレート・アニメーションのためのKnot Forcingという新しいストリーミング・フレームワークを提案する。
Kノットフォーシングは、無限列上の高忠実で時間的に一貫性があり、インタラクティブなポートレートアニメーションを可能にする。
論文 参考訳(メタデータ) (2025-12-25T16:34:56Z) - Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation [70.86886231976439]
Soulは、高忠実な長期デジタルヒューマンアニメーションのためのフレームワークである。
単一のフレームのポートレートイメージ、テキストプロンプト、オーディオからセマンティックコヒーレントなビデオを生成する。
正確な唇の同期、鮮やかな表情、堅牢なアイデンティティ保存を実現している。
論文 参考訳(メタデータ) (2025-12-15T16:25:56Z) - Deep Forcing: Training-Free Long Video Generation with Deep Sink and Participative Compression [36.99018442740971]
映像拡散にStreamingLLMスタイルのアテンションシンクを鼻で適用すると、忠実度が低下し、動きが停滞することがわかった。
我々は、微調整なしでこれに対応する2つのトレーニング不要なメカニズムからなるDeep Forcingを紹介した。
以上の結果から,トレーニングフリーなKV-cache管理は,自動回帰ストリーミング長ビデオ生成のためのトレーニングベースアプローチと一致するか,あるいは超える可能性があることが示唆された。
論文 参考訳(メタデータ) (2025-12-04T18:46:44Z) - Zero-shot High-fidelity and Pose-controllable Character Animation [89.74818983864832]
イメージ・ツー・ビデオ(I2V)生成は、単一の画像からビデオシーケンスを作成することを目的としている。
既存のアプローチは、キャラクターの外観の不整合と細部保存の貧弱さに悩まされている。
文字アニメーションのための新しいゼロショットI2VフレームワークPoseAnimateを提案する。
論文 参考訳(メタデータ) (2024-04-21T14:43:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。