論文の概要: AnimateAnyMesh++: A Flexible 4D Foundation Model for High-Fidelity Text-Driven Mesh Animation
- arxiv url: http://arxiv.org/abs/2604.26917v1
- Date: Wed, 29 Apr 2026 17:27:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.519101
- Title: AnimateAnyMesh++: A Flexible 4D Foundation Model for High-Fidelity Text-Driven Mesh Animation
- Title(参考訳): AnimateAnyMesh++: 高忠実なテキスト駆動メッシュアニメーションのためのフレキシブルな4Dファンデーションモデル
- Authors: Zijie Wu, Chaohui Yu, Fan Wang, Xiang Bai,
- Abstract要約: AnimateAnyMesh++は任意の3Dメッシュのテキスト駆動アニメーションのためのフィードフォワードフレームワークである。
AnimateAnyMesh++はセマンティックに正確で時間的にコヒーレントなメッシュアニメーションを数秒で生成する。
- 参考スコア(独自算出の注目度): 60.958967260016976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in 4D content generation have attracted increasing attention, yet creating high-quality animated 3D models remains challenging due to the complexity of modeling spatio-temporal distributions and the scarcity of 4D training data. We present AnimateAnyMesh++, a feed-forward framework for text-driven animation of arbitrary 3D meshes with substantial upgrades in data, architecture, and generative capability. First, we expand the DyMesh-XL dataset by mining dynamic content from Objaverse-XL, increasing the number of unique identities from 60K to 300K and substantially broadening category and motion diversity. Second, we redesign DyMeshVAE-Flex with power-law topology-aware attention and vertex-normal enhanced features, which significantly improves trajectory reconstruction, local geometry preservation, and mitigates trajectory-sticking artifacts. Third, we introduce architectural changes to both DyMeshVAE-Flex and the rectified-flow (RF) generator to support variable-length sequence training and generation, enabling longer animations while preserving reconstruction fidelity. Extensive experiments demonstrate that AnimateAnyMesh++ generates semantically accurate and temporally coherent mesh animations within seconds, surpassing prior approaches in quality and efficiency. The enlarged DyMesh-XL, the upgraded DyMeshVAE-Flex, and variable-length RF together deliver consistent gains across benchmarks and in-the-wild meshes. We will release code, models, and the expanded DyMesh-XL upon acceptance of this manuscript to facilitate research in 4D content creation.
- Abstract(参考訳): 近年の4Dコンテンツ生成の進歩が注目されているが、時空間分布のモデリングの複雑さと4Dトレーニングデータの不足により、高品質な3Dモデルを作成することは依然として困難である。
AnimateAnyMesh++は、任意の3Dメッシュのテキスト駆動アニメーションのためのフィードフォワードフレームワークで、データ、アーキテクチャ、生成機能を大幅にアップグレードする。
まず、Objaverse-XLから動的コンテンツをマイニングすることでDyMesh-XLデータセットを拡張し、60Kから300Kまでのユニークなアイデンティティの数を増やし、カテゴリと動きの多様性を大幅に広げる。
第二に,我々はDyMeshVAE-Flexを再設計し,トポロジを意識したトポロジと頂点正規化機能を導入し,トラジェクトリ再構成,局所的な地形保存,トラジェクトリスティックアーティファクトの軽減を実現した。
第3に、DyMeshVAE-Flexと修正フロー(RF)ジェネレータの両方にアーキテクチャ変更を導入し、可変長シーケンスのトレーニングと生成をサポートし、再現性を維持しながらより長いアニメーションを可能にする。
大規模な実験では、AnimateAnyMesh++が数秒でセマンティックに正確で時間的にコヒーレントなメッシュアニメーションを生成し、品質と効率の従来のアプローチを上回ることが示されている。
拡張されたDyMesh-XL、アップグレードされたDyMeshVAE-Flex、可変長RFは、ベンチマークとWildメッシュ間で一貫した利得を提供する。
この原稿を受理し、4Dコンテンツ作成の研究を促進するため、コード、モデル、拡張されたDyMesh-XLをリリースする。
関連論文リスト
- Gaussian Variation Field Diffusion for High-fidelity Video-to-4D Synthesis [31.632778145139074]
直接4次元拡散モデリングは、コストの高いデータ構築と3次元形状、外観、動きを共同で表現する高次元の性質のため、極めて困難である。
我々は,標準ガウスを直接符号化する4DMesh-to-GS Variation Field VAEと,その時間変化を3Dアニメーションデータから紹介する。
入力ビデオと標準GSで条件付き時間認識拡散変換器を訓練する。
論文 参考訳(メタデータ) (2025-07-31T17:59:51Z) - AnimateAnyMesh: A Feed-Forward 4D Foundation Model for Text-Driven Universal Mesh Animation [57.199352741915625]
本稿では,任意の3Dメッシュの効率的なテキスト駆動アニメーションを可能にする最初のフィードフォワードフレームワークであるAnimateAnyMeshを紹介する。
我々のアプローチは、動的メッシュシーケンスを効果的に圧縮し再構成する新しいDyMeshVAEアーキテクチャを活用する。
また、DyMeshデータセットにもコントリビュートし、テキストアノテーション付き4M以上の動的メッシュシーケンスを格納しています。
論文 参考訳(メタデータ) (2025-06-11T17:55:16Z) - MagicArticulate: Make Your 3D Models Articulation-Ready [109.35703811628045]
静的な3Dモデルを自動的に調音可能なアセットに変換する効果的なフレームワークであるMagicArticulateを提案する。
まず,高品質な調音アノテーションを備えた33k以上の3Dモデルを含むArticulation-averseベンチマークを紹介し,XL-XLから慎重にキュレートする。
大規模な実験では、MagicArticulateはさまざまなオブジェクトカテゴリで既存のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-02-17T18:53:27Z) - Bringing Objects to Life: training-free 4D generation from 3D objects through view consistent noise [31.533802484121182]
テキストプロンプトを条件に4D生成を誘導することで,3Dオブジェクトをアニメーション化するためのトレーニング不要な手法を提案する。
まず,3次元メッシュを物体の視覚特性を保存する4次元ニューラルラジアンス場(NeRF)に変換する。
そして,テキスト駆動画像拡散モデルを用いてオブジェクトをアニメーション化する。
論文 参考訳(メタデータ) (2024-12-29T10:12:01Z) - DRiVE: Diffusion-based Rigging Empowers Generation of Versatile and Expressive Characters [15.626704323367983]
DRiVEは複雑な構造を持つ3Dヒューマンキャラクタの生成とリグのための新しいフレームワークである。
コードとデータセットは受理後、学術的利用のために公開される。
論文 参考訳(メタデータ) (2024-11-26T13:30:41Z) - InstantMesh: Efficient 3D Mesh Generation from a Single Image with Sparse-view Large Reconstruction Models [66.83681825842135]
InstantMeshは、単一のイメージからインスタント3Dメッシュを生成するためのフィードフォワードフレームワークである。
最新世代の品質とトレーニングのスケーラビリティが特徴だ。
InstantMeshのコード、重み、デモをすべてリリースし、3D生成AIのコミュニティに多大な貢献ができることを意図しています。
論文 参考訳(メタデータ) (2024-04-10T17:48:37Z) - DreamGaussian4D: Generative 4D Gaussian Splatting [56.49043443452339]
DG4D(DreamGaussian 4D:DreamGaussian 4D)はGaussian Splatting(GS)をベースとした効率的な4D生成フレームワークである。
我々の重要な洞察は、空間変換の明示的なモデリングと静的GSを組み合わせることで、4次元生成の効率的かつ強力な表現ができるということである。
ビデオ生成手法は、高画質の4D生成を向上し、価値ある時空間前兆を提供する可能性がある。
論文 参考訳(メタデータ) (2023-12-28T17:16:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。