論文の概要: AnimationBench: Are Video Models Good at Character-Centric Animation?
- arxiv url: http://arxiv.org/abs/2604.15299v1
- Date: Thu, 16 Apr 2026 17:57:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:32.045094
- Title: AnimationBench: Are Video Models Good at Character-Centric Animation?
- Title(参考訳): AnimationBench: ビデオモデルはキャラクター中心のアニメーションに優れているか?
- Authors: Leyi Wu, Pengjun Fang, Kai Sun, Yazhou Xing, Yinwei Wu, Songsong Wang, Ziqi Huang, Dan Zhou, Yingqing He, Ying-Cong Chen, Qifeng Chen,
- Abstract要約: AnimationBenchはアニメーション画像とビデオの生成を評価するための最初の体系的なベンチマークである。
アニメーションの基本原則とIP保存を計測可能な評価次元に運用する。
リアリズム指向のベンチマークで見過ごされるアニメーション固有の品質差を公開する。
- 参考スコア(独自算出の注目度): 67.15372653996833
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video generation has advanced rapidly, with recent methods producing increasingly convincing animated results. However, existing benchmarks-largely designed for realistic videos-struggle to evaluate animation-style generation with its stylized appearance, exaggerated motion, and character-centric consistency. Moreover, they also rely on fixed prompt sets and rigid pipelines, offering limited flexibility for open-domain content and custom evaluation needs. To address this gap, we introduce AnimationBench, the first systematic benchmark for evaluating animation image-to-video generation. AnimationBench operationalizes the Twelve Basic Principles of Animation and IP Preservation into measurable evaluation dimensions, together with Broader Quality Dimensions including semantic consistency, motion rationality, and camera motion consistency. The benchmark supports both a standardized close-set evaluation for reproducible comparison and a flexible open-set evaluation for diagnostic analysis, and leverages visual-language models for scalable assessment. Extensive experiments show that AnimationBench aligns well with human judgment and exposes animation-specific quality differences overlooked by realism-oriented benchmarks, leading to more informative and discriminative evaluation of state-of-the-art I2V models.
- Abstract(参考訳): ビデオ生成は急速に進歩し、最近の手法はますます説得力のあるアニメーション結果を生み出している。
しかし、既存のベンチマークは、アニメーションスタイルの生成をスタイル化された外観、誇張された動き、キャラクター中心の一貫性で評価するために、リアルなビデオストルグルのために設計されている。
さらに、固定プロンプトセットや堅固なパイプラインにも依存しており、オープンドメインコンテンツやカスタム評価ニーズに対する柔軟性が制限されている。
このギャップに対処するために,アニメーション画像から映像への生成を評価するための最初の体系的ベンチマークであるAnimationBenchを紹介する。
AnimationBenchは、セマンティック一貫性、モーション合理性、カメラモーション整合性を含むブロード品質次元とともに、アニメーションとIP保存の12の基本原則を計測可能な評価次元に運用する。
このベンチマークは再現性比較のための標準化されたクローズセット評価と診断分析のための柔軟なオープンセット評価の両方をサポートし、スケーラブルな評価のために視覚言語モデルを活用する。
広範囲な実験により、アニメーションベンチは人間の判断とよく一致し、リアリズム指向のベンチマークで見過ごされるアニメーション特有の品質差を露呈し、最先端のI2Vモデルのより情報的で差別的な評価をもたらすことが示されている。
関連論文リスト
- MVAnimate: Enhancing Character Animation with Multi-View Optimization [55.4217617472079]
MVAnimateは,マルチビュー先行情報に基づく動的図形の2次元情報と3次元情報の両方を合成する新しいフレームワークである。
提案手法は,複数ビュー先行情報を利用して時間的一貫性と空間的整合性のあるアニメーション出力を生成する。
論文 参考訳(メタデータ) (2026-02-09T14:55:21Z) - VMBench: A Benchmark for Perception-Aligned Video Motion Generation [22.891770315274346]
包括的なビデオモーションベンチマークであるVMBenchを紹介する。
VMBenchは知覚対応のモーションメトリクスを持ち、最も多様なモーションを特徴としている。
人間の知覚的アライメントの観点から動画における動きの質が評価されたのはこれが初めてである。
論文 参考訳(メタデータ) (2025-03-13T05:54:42Z) - AniSora: Exploring the Frontiers of Animation Video Generation in the Sora Era [20.670217061810614]
本稿では,アニメーション映像生成のための総合システムAniSoraを提案する。
1000万以上の高品質なデータでデータ処理パイプラインがサポートしています。
また,様々なアニメーションビデオの評価ベンチマークを収集し,特にアニメーションビデオ生成のための指標を開発した。
論文 参考訳(メタデータ) (2024-12-13T16:24:58Z) - Towards Multiple Character Image Animation Through Enhancing Implicit Decoupling [77.08568533331206]
文字画像アニメーションのための新しい多条件ガイドフレームワークを提案する。
我々は、モデルが暗黙的に疎結合する能力を高めるために、よく設計された入力モジュールをいくつか採用する。
本手法は,特に複雑な背景と複数の文字のシナリオにおいて,高品質なキャラクタアニメーションの生成に優れる。
論文 参考訳(メタデータ) (2024-06-05T08:03:18Z) - Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation [27.700371215886683]
拡散モデルは、その堅牢な生成能力のために、視覚世代研究の主流となっている。
本稿では,キャラクターアニメーションに適した新しいフレームワークを提案する。
トレーニングデータを拡張することにより、任意の文字をアニメーション化することが可能となり、他の画像とビデオの手法と比較して、文字アニメーションにおいて優れた結果が得られる。
論文 参考訳(メタデータ) (2023-11-28T12:27:15Z) - MagicAnimate: Temporally Consistent Human Image Animation using
Diffusion Model [74.84435399451573]
本稿では、特定の動きシーケンスに従って、特定の参照アイデンティティのビデオを生成することを目的とした、人間の画像アニメーションタスクについて検討する。
既存のアニメーションは、通常、フレームウォーピング技術を用いて参照画像を目標運動に向けてアニメーションする。
MagicAnimateは,時間的一貫性の向上,参照画像の忠実な保存,アニメーションの忠実性向上を目的とした,拡散に基づくフレームワークである。
論文 参考訳(メタデータ) (2023-11-27T18:32:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。