論文の概要: AniMatrix: An Anime Video Generation Model that Thinks in Art, Not Physics
- arxiv url: http://arxiv.org/abs/2605.03652v2
- Date: Thu, 07 May 2026 12:35:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.293681
- Title: AniMatrix: An Anime Video Generation Model that Thinks in Art, Not Physics
- Title(参考訳): AniMatrix: 物理ではなく芸術を思い浮かべるアニメビデオ生成モデル
- Authors: Tencent HY Team,
- Abstract要約: AniMatrixは、物理的正確性ではなく芸術性を再定義するビデオ生成モデルである。
AniMatrixは、二重チャネルの条件付け機構と3段階の遷移によって、物理的な正確さよりも芸術性を目標としている。
プロのアニメーターによる5つの制作次元を持つアニメ固有の人間評価において、AniMatrixは5つ中4つにランクインしている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video generation models internalize physical realism as their prior. Anime deliberately violates physics: smears, impact frames, chibi shifts; and its thousands of coexisting artistic conventions yield no single "physics of anime" a model can absorb. Physics-biased models therefore flatten the artistry that defines the medium or collapse under its stylistic variance. We present AniMatrix, a video generation model that targets artistic rather than physical correctness through a dual-channel conditioning mechanism and a three-step transition: redefine correctness, override the physics prior, and distinguish art from failure. First, a Production Knowledge System encodes anime as a structured taxonomy of controllable production variables (Style, Motion, Camera, VFX), and AniCaption infers these variables from pixels as directorial directives. A trainable tag encoder preserves the field-value structure of this taxonomy while a frozen T5 encoder handles free-form narrative; dual-path injection (cross-attention for fine-grained control, AdaLN modulation for global enforcement) ensures categorical directives are never diluted by open-ended text. Second, a style-motion-deformation curriculum transitions the model from near-physical motion to full anime expressiveness. Third, deformation-aware preference optimization with a domain-specific reward model separates intentional artistry from pathological collapse. On an anime-specific human evaluation with five production dimensions scored by professional animators, AniMatrix ranks first on four of five, with the largest gains over Seedance-Pro 1.0 on Prompt Understanding (+0.70, +22.4 percent) and Artistic Motion (+0.55, +16.9 percent). We are preparing accompanying resources for public release to support reproducibility and follow-up research.
- Abstract(参考訳): ビデオ生成モデルは、物理リアリズムをそれ以前のものとして内部化する。
アニメは、スミア、衝撃フレーム、チビのシフトといった物理学に意図的に違反し、その数千の共存する芸術的慣習は、モデルが吸収できる唯一の「アニメの物理学」を生み出しない。
したがって、物理バイアスのあるモデルは、その様式的な分散の下で媒体や崩壊を定義する芸術性をフラットにする。
AniMatrixは、二重チャネル条件付け機構と3段階の遷移により、物理的正確性よりも芸術性を目標とするビデオ生成モデルである。
まず、生産知識システムは、制御可能な生産変数(スタイル、モーション、カメラ、VFX)の構造化分類としてアニメを符号化し、AniCaptionはこれらの変数を画素からディレクトリディレクティブとして推論する。
訓練可能なタグエンコーダは、この分類のフィールド値構造を保ち、凍結されたT5エンコーダは、自由形式の物語を扱う。
第二に、スタイル・モーション・デフォーメーションのカリキュラムは、モデルをほぼ物理運動から完全なアニメ表現に移行させる。
第三に、ドメイン固有の報酬モデルによる変形認識の好みの最適化は、意図的な芸術性を病理的な崩壊から切り離す。
アニマトリクスはプロのアニメーターによる5つの制作次元を持つアニメ固有の人間評価において、プロンプト理解(+0.70, +22.4%)とアーティスティック・モーション(+0.55, +16.9%)でSeedance-Pro 1.0の4位にランクインしている。
再現性およびフォローアップ研究を支援するため、公募に付随する資源を準備している。
関連論文リスト
- LottieGPT: Tokenizing Vector Animation for Autoregressive Generation [63.27046904946992]
ベクトルアニメーションは解像度独立性、コンパクト性、意味構造、パラメトリック編集可能な動き表現を提供する。
現在の生成モデルは宇宙でのみ動作するため、合成はできない。
我々はQwen-VLを微調整し、コヒーレントで編集可能なベクトルアニメーションを生成することができるネイティブマルチモーダルモデルであるLottieGPTを作成する。
論文 参考訳(メタデータ) (2026-04-13T17:55:40Z) - See-through: Single-image Layer Decomposition for Anime Characters [11.629918493740263]
本稿では,静的アニメイラストをマニピュラブル2.5Dモデルに変換するフレームワークを提案する。
当社のアプローチでは、ひとつの画像を完全に塗装されたセマンティックな異なる層に分解することで、これを克服しています。
提案手法により,プロのリアルタイムアニメーションアプリケーションに適した高忠実でマニピュラブルなモデルが得られることを示す。
論文 参考訳(メタデータ) (2026-02-03T17:12:36Z) - PhysAnimator: Physics-Guided Generative Cartoon Animation [19.124321553546242]
PhysAnimatorは、静的アニメイラストからアニメスティル化されたアニメーションを生成するための新しいアプローチである。
アニメの流動性と誇張特性を捉えるため,抽出したメッシュ地形上で画像空間の変形可能な物体シミュレーションを行った。
シミュレーションシーケンスからスケッチを抽出し、テクスチャに依存しない表現を生成し、スケッチ誘導映像拡散モデルを用いて高品質なアニメーションフレームを合成する。
論文 参考訳(メタデータ) (2025-01-27T22:48:36Z) - Generative AI for Cel-Animation: A Survey [59.20171452237911]
GenAIは、技術的な障壁を減らし、幅広いクリエイターへのアクセシビリティを広げることで、伝統的なアニメーションに革命をもたらしている。
その可能性にもかかわらず、一貫性、スタイリスティックなコヒーレンス、倫理的考察といった課題が続いている。
本稿では,AI支援アニメーションの今後の方向性について考察する。
論文 参考訳(メタデータ) (2025-01-08T20:57:39Z) - AniDoc: Animation Creation Made Easier [54.97341104616779]
我々の研究は、ますます強力なAIの可能性を生かして、2Dアニメーションを制作する際のコスト削減に重点を置いている。
AniDocはビデオラインアートのカラー化ツールとして登場し、自動的にスケッチシーケンスをカラーアニメーションに変換する。
本モデルでは,一致マッチングを明示的なガイダンスとして活用し,基準文字と各ラインアートフレームの変動に強いロバスト性を与える。
論文 参考訳(メタデータ) (2024-12-18T18:59:59Z) - Towards High-Quality 3D Motion Transfer with Realistic Apparel Animation [69.36162784152584]
本研究では,現実的なアパレルアニメーションを用いた高品質な動き伝達を目的とした新しい手法を提案する。
本稿では,2つのニューラル変形モジュールを介し,物体とアパレルの変形を学習するデータ駆動パイプラインを提案する。
本手法は各種アパレルの品質に優れた結果をもたらす。
論文 参考訳(メタデータ) (2024-07-15T22:17:35Z) - Animatable Implicit Neural Representations for Creating Realistic
Avatars from Videos [63.16888987770885]
本稿では,マルチビュー映像からアニマタブルな人間モデルを構築することの課題について述べる。
線形ブレンドスキンアルゴリズムに基づくポーズ駆動変形場を提案する。
提案手法は,近年の人体モデリング手法よりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:56:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。