論文の概要: FreeAnimate: Training-Free Human Image Animation with Preview-Guided Denoising
- arxiv url: http://arxiv.org/abs/2606.06885v1
- Date: Fri, 05 Jun 2026 04:06:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.556342
- Title: FreeAnimate: Training-Free Human Image Animation with Preview-Guided Denoising
- Title(参考訳): FreeAnimate: プレビューガイドによる人間のイメージアニメーション
- Authors: Yuan Zeng, Yujia Shi, Zongqing Lu, QingMin Liao,
- Abstract要約: FreeAnimateは、時間的一貫性、アイデンティティ保存、バックグラウンド安定性を可能にするトレーニング不要のフレームワークである。
提案手法は、生成したプレビューフレームから時間的および構造的事前情報を提供する新しいプレビュー生成戦略を取り入れている。
Inversion-Boosted AttentionとReference-Anchored Self-Attentionモジュールは、時間的一貫性とアイデンティティ保護を保証する。
- 参考スコア(独自算出の注目度): 42.49370331702092
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human Image Animation has seen significant advancements, primarily driven by diffusion models. However, existing methods typically demand substantial training data and resources to achieve high-quality results, limiting generalization and accessibility. In this work, we introduce \emph{FreeAnimate}, a training-free framework that leverages the inherent capabilities of image diffusion models to enable temporal consistency, identity preservation, and background stability. Our approach incorporates a novel preview generation strategy that provides temporal and structural priors from generated preview frames, effectively guiding pose alignment and background consistency without training. Additionally, FreeAnimate introduces Inversion-Boosted Attention and Reference-Anchored Self-Attention modules to guarantee temporal consistency and identity preservation. Experimental results demonstrate that FreeAnimate outperforms existing training-free competitors and training-based baseline methods, achieving generation quality comparable to state-of-the-art methods and offering robust generalization across diverse datasets. Our project page is at https://freeani.github.io/.
- Abstract(参考訳): 人間のイメージアニメーションは、主に拡散モデルによって大きく進歩した。
しかし、既存の手法では、一般的に、高度なデータとリソースが要求され、一般化とアクセシビリティが制限される。
本研究では,画像拡散モデル固有の機能を活用して,時間的一貫性,アイデンティティ保存,背景安定性を実現するトレーニングフリーフレームワークである \emph{FreeAnimate} を紹介する。
提案手法では,生成したプレビューフレームから時間的および構造的事前情報を提供する新しいプレビュー生成戦略を取り入れ,ポーズアライメントと背景一貫性をトレーニングなしで効果的に導く。
さらにFreeAnimateは、時間的一貫性とアイデンティティ保存を保証するために、Inversion-Boosted AttentionとReference-Anchored Self-Attentionモジュールを導入した。
実験の結果、FreeAnimateは既存のトレーニングフリーの競合他社やトレーニングベースのベースラインメソッドよりも優れており、最先端の手法に匹敵する生成品質を達成し、多様なデータセットをまたいだ堅牢な一般化を提供することが示された。
私たちのプロジェクトページはhttps://freeani.github.io/です。
関連論文リスト
- PersonaLive! Expressive Portrait Image Animation for Live Streaming [53.63615310186964]
PersonaLiveは、リアルタイムのポートレートアニメーションをストリーミングするための、新しい拡散ベースのフレームワークである。
まず,暗黙の表情と3次元の暗黙のキーポイントというハイブリッドな暗黙の信号を用いて,表現力のある画像レベルの動作制御を実現する。
実験により、PersonaLiveは、従来の拡散ベースのポートレートアニメーションモデルよりも最大7-22倍のスピードアップで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2025-12-12T03:24:40Z) - Flux Already Knows -- Activating Subject-Driven Image Generation without Training [25.496237241889048]
バニラフラックスモデルを用いた画像生成のためのゼロショットフレームワークを提案する。
我々は、追加のデータ、トレーニング、推論時の微調整なしで強力なID保存機能を起動する。
論文 参考訳(メタデータ) (2025-04-12T20:41:53Z) - StableAnimator: High-Quality Identity-Preserving Human Image Animation [64.63765800569935]
本稿では,最初のエンドツーエンドID保存ビデオ拡散フレームワークであるStableAnimatorについて述べる。
ポストプロセッシングなしで高品質なビデオを合成し、参照画像とポーズのシーケンスに条件付けする。
推論中,顔の質をより高めるためにハミルトン・ヤコビベルマン(HJB)方程式に基づく新しい最適化を提案する。
論文 参考訳(メタデータ) (2024-11-26T18:59:22Z) - UniAnimate: Taming Unified Video Diffusion Models for Consistent Human Image Animation [53.16986875759286]
We present a UniAnimate framework to enable efficient and long-term human video generation。
我々は、姿勢案内やノイズビデオとともに参照画像を共通の特徴空間にマッピングする。
また、ランダムノイズ入力と第1フレーム条件入力をサポートする統一ノイズ入力を提案する。
論文 参考訳(メタデータ) (2024-06-03T10:51:10Z) - Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation [27.700371215886683]
拡散モデルは、その堅牢な生成能力のために、視覚世代研究の主流となっている。
本稿では,キャラクターアニメーションに適した新しいフレームワークを提案する。
トレーニングデータを拡張することにより、任意の文字をアニメーション化することが可能となり、他の画像とビデオの手法と比較して、文字アニメーションにおいて優れた結果が得られる。
論文 参考訳(メタデータ) (2023-11-28T12:27:15Z) - MagicAnimate: Temporally Consistent Human Image Animation using
Diffusion Model [74.84435399451573]
本稿では、特定の動きシーケンスに従って、特定の参照アイデンティティのビデオを生成することを目的とした、人間の画像アニメーションタスクについて検討する。
既存のアニメーションは、通常、フレームウォーピング技術を用いて参照画像を目標運動に向けてアニメーションする。
MagicAnimateは,時間的一貫性の向上,参照画像の忠実な保存,アニメーションの忠実性向上を目的とした,拡散に基づくフレームワークである。
論文 参考訳(メタデータ) (2023-11-27T18:32:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。