論文の概要: AnimaSpark: A Feed-Forward Method for Animating Arbitrary 3D Objects
- arxiv url: http://arxiv.org/abs/2606.10988v1
- Date: Tue, 09 Jun 2026 15:25:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.581935
- Title: AnimaSpark: A Feed-Forward Method for Animating Arbitrary 3D Objects
- Title(参考訳): AnimaSpark: 任意の3Dオブジェクトをアニメーションするためのフィードフォワード方式
- Authors: Yiming Zhao, Haoyu Sun, Aoyu Wang,
- Abstract要約: カテゴリーに依存しないアニメーション生成の現在の手法は、推論速度、運動品質、テキストプロンプトへの付着に限界がある。
本稿では,カテゴリに依存しない3Dアニメーション生成のための新しいパイプラインであるAnimaSparkを紹介する。
本手法は,テキスト・モーションアライメント,動きの質,計算効率など,従来の最先端技術よりも優れた性能を実現する。
- 参考スコア(独自算出の注目度): 9.201202105097991
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While recent advancements in generative AI have substantially accelerated static 3D model creation workflows, the synthesis of category-agnostic 3D animations remains a significant bottleneck in 3D asset production. Current methods for category-agnostic animation generation exhibit critical limitations in inference speed, motion quality, and adherence to textual prompts, thereby leaving the process dependent on labor-intensive manual artistry. To address these challenges, this paper introduces AnimaSpark, a novel pipeline for category-agnostic 3D animation generation. Our approach is motivated by the key insight that for many fundamental motions in the 3D world, the corresponding joint transformations can often be effectively modeled within a two-dimensional subspace. The pipeline begins by rendering a rigged static 3D model into multi-layered image representations of its mesh and skeleton, which are subsequently fed into a video generation model. We then employ a keypoint tracking algorithm on the generated video to capture the motion of the skeletal joints projected onto the camera's viewing plane. In the final stage, we distill the planar translations and rotations from these tracked keypoints and lift them from the 2D domain into 3D space to animate the character. Comprehensive evaluations reveal that our method achieves superior performance over existing state-of-the-art techniques across key metrics, including text-motion alignment, quality of motion, and computational efficiency.
- Abstract(参考訳): 生成AIの最近の進歩は静的な3Dモデル作成ワークフローを大幅に加速しているが、カテゴリに依存しない3Dアニメーションの合成は、3Dアセット生産において大きなボトルネックとなっている。
カテゴリーに依存しないアニメーション生成の現在の手法は、推論速度、動きの質、テキストのプロンプトへの順守に限界があり、それによって、労働集約的な手芸に依存している。
これらの課題に対処するために,カテゴリに依存しない3Dアニメーション生成のための新しいパイプラインであるAnimaSparkを紹介する。
我々のアプローチは、3次元世界の多くの基本運動に対して、対応する関節変換は2次元部分空間内で効果的にモデル化できるという重要な洞察に動機付けられている。
パイプラインは、トリグされた静的な3Dモデルをメッシュとスケルトンの多層イメージ表現にレンダリングすることから始まり、その後、ビデオ生成モデルに入力される。
次に、生成したビデオのキーポイント追跡アルゴリズムを用いて、カメラの視界に投影された骨格関節の動きをキャプチャする。
最終段階では、これらの追跡されたキーポイントから平面変換と回転を蒸留し、2次元領域から3次元空間に上げ、キャラクタをアニメーション化する。
総合評価の結果,本手法は,テキスト・モーションアライメント,動きの質,計算効率など,従来の最先端技術よりも優れた性能を実現していることがわかった。
関連論文リスト
- MotionDreamer: Universal Skeletal Motion Generation for 3D Rigged Shapes [52.45449797329548]
MotionDreamerは、2Dビデオガイダンスからカテゴリに依存しない骨格アニメーションを生成するための拡散ベースのフレームワークである。
本研究では,2次元視覚運動キューとヘテロジニアスな3次元骨格構造とのギャップを埋める構造的意味注入機構を提案する。
提案手法は既存の手法を著しく上回り、堅牢で効率的な4Dアセット生成のための最先端のベンチマークを新たに設定する。
論文 参考訳(メタデータ) (2026-06-01T00:42:31Z) - 3DProxyImg: Controllable 3D-Aware Animation Synthesis from Single Image via 2D-3D Aligned Proxy Embedding [46.75707405618843]
外観合成から幾何学的制御を分離する軽量な3Dアニメーションフレームワークを提案する。
提案手法は,低消費電力プラットフォーム上での効率的なアニメーション生成を実現する。
論文 参考訳(メタデータ) (2025-12-17T06:38:07Z) - Drag4D: Align Your Motion with Text-Driven 3D Scene Generation [77.79131321983677]
Drag4Dはインタラクティブなフレームワークで、テキスト駆動の3Dシーン生成にオブジェクトの動き制御を統合する。
このフレームワークにより、ユーザーは単一の画像から生成された3Dオブジェクトに対して3Dトラジェクトリを定義し、それらを高品質な3D背景にシームレスに統合することができる。
論文 参考訳(メタデータ) (2025-09-26T05:23:45Z) - Puppeteer: Rig and Animate Your 3D Models [105.11046762553121]
Puppeteerは、さまざまな3Dオブジェクトの自動リギングとアニメーションの両方に対処する包括的なフレームワークである。
本システムはまず, 自己回帰変換器を用いて, 可塑性骨格構造を推定する。
その後、注意に基づくアーキテクチャにより、皮膚の重量を推定する。
論文 参考訳(メタデータ) (2025-08-14T17:59:31Z) - Layered Motion Fusion: Lifting Motion Segmentation to 3D in Egocentric Videos [71.24593306228145]
本研究では,2次元モデルから層状放射場への運動分割予測を融合させることにより,3次元の動的セグメンテーションを改善することを提案する。
テスト時間の改善によってこの問題に対処し、モデルが特定のフレームに集中できるようにし、データの複雑さを軽減します。
このことは、3D技術が挑戦的で現実的な環境での動的現象に対しても2次元解析を向上できることを証明している。
論文 参考訳(メタデータ) (2025-06-05T19:46:48Z) - Gaussians-to-Life: Text-Driven Animation of 3D Gaussian Splatting Scenes [49.26872036160368]
ガウススティング表現における高品質な3Dシーンの一部をアニメーションする手法を提案する。
従来の作業とは対照的に、複雑な既存の3Dシーンのリアルなアニメーションを可能にする。
論文 参考訳(メタデータ) (2024-11-28T16:01:58Z) - Action2video: Generating Videos of Human 3D Actions [31.665831044217363]
我々は、所定のアクションカテゴリから多様で自然な人間の動きのビデオを生成するという、興味深いが挑戦的な課題に取り組むことを目的としている。
重要な問題は、視覚的な外観で現実的な複数の異なる動き列を合成する能力にある。
Action2motionallyは、所定のアクションカテゴリのもっともらしい3Dポーズシーケンスを生成し、モーション2ビデオによって処理され、レンダリングされ、2Dビデオを形成する。
論文 参考訳(メタデータ) (2021-11-12T20:20:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。