論文の概要: MotionDreamer: Universal Skeletal Motion Generation for 3D Rigged Shapes
- arxiv url: http://arxiv.org/abs/2606.01518v1
- Date: Mon, 01 Jun 2026 00:42:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.76007
- Title: MotionDreamer: Universal Skeletal Motion Generation for 3D Rigged Shapes
- Title(参考訳): MotionDreamer: 3D Rigged Shapesのためのユニバーサル骨格モーションジェネレーション
- Authors: Ye Tao, Yuxin Yao, Kendong Liu, Dapeng Wu, Junhui Hou,
- Abstract要約: MotionDreamerは、2Dビデオガイダンスからカテゴリに依存しない骨格アニメーションを生成するための拡散ベースのフレームワークである。
本研究では,2次元視覚運動キューとヘテロジニアスな3次元骨格構造とのギャップを埋める構造的意味注入機構を提案する。
提案手法は既存の手法を著しく上回り、堅牢で効率的な4Dアセット生成のための最先端のベンチマークを新たに設定する。
- 参考スコア(独自算出の注目度): 52.45449797329548
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motion generation for rigged shapes is vital for scalable 4D asset production. However, template-based methods are limited by specific topologies and fail to generalize across diverse morphologies. Conversely, per-case optimization is computationally expensive, susceptible to local optima, and highly sensitive to viewpoint-induced ambiguities. In this paper, we present MotionDreamer, a diffusion-based framework designed for category-agnostic skeletal animation generation from 2D video guidance. To overcome the scarcity of high-quality training data, we have curated a large-scale dynamic dataset comprising approximately 20,000 diverse 3D models, each featuring complete textures, skeletal rigging, and a wide array of comprehensive animation sequences. To bridge the kinematic gap between 2D visual motion cues and heterogeneous 3D skeletal structures, we propose a structural-semantic injection mechanism. Our model integrates texture and semantic attributes directly into skeletal joint representations. This allows it to map perceived visual dynamics to specific joint hierarchies and their functional roles. This enables MotionDreamer to synthesize high-fidelity animations that maintain anatomical consistency across a vast range of unseen categories, from existing biological species to fantastical beings. Extensive experiments demonstrate that our approach significantly outperforms existing methods, setting a new state-of-the-art benchmark for robust and efficient 4D asset generation. The code will be made publicly available upon acceptance.
- Abstract(参考訳): 剛体形状の運動生成はスケーラブルな4Dアセット生産に不可欠である。
しかし、テンプレートベースの手法は特定のトポロジーによって制限され、様々な形態をまたいだ一般化に失敗する。
逆に、ケースごとの最適化は計算コストが高く、局所的な最適性に影響を受けやすく、視点によるあいまいさに非常に敏感である。
本稿では,2次元ビデオガイダンスからカテゴリに依存しない骨格アニメーションを生成するための拡散型フレームワークであるMotionDreamerを提案する。
高品質なトレーニングデータの不足を克服するため,約2万の多様な3Dモデルからなる大規模動的データセットをキュレートした。
2次元視覚運動キューとヘテロジニアスな3次元骨格構造との間の運動的ギャップを埋めるために,構造意味注入機構を提案する。
我々のモデルは、テクスチャとセマンティック属性を直接骨格関節表現に統合する。
これにより、知覚された視覚力学を特定の関節階層とその機能的役割にマッピングすることができる。
これにより、MotionDreamerは、既存の生物種から幻想的な生物まで、さまざまな未確認カテゴリーにわたる解剖学的一貫性を維持する高忠実なアニメーションを合成することができる。
大規模な実験により、我々の手法は既存の手法よりも大幅に優れており、ロバストで効率的な4Dアセット生成のための新しい最先端のベンチマークが設定されている。
コードは受理時に公開されます。
関連論文リスト
- Rigel3D: Rig-aware Latents for Animation-Ready 3D Asset Generation [6.821657791615377]
Rigel3Dはアニメーション対応の3Dアセットをリップメッシュとして生成する方法である。
rig対応オートエンコーダは、これらの表現をメッシュ幾何学、骨格位相、関節座標、スキンウェイトにデコードする。
2段階の潜伏生成モデルは、画像条件付き生成のための表面表現と骨格表現の両方を合成する。
論文 参考訳(メタデータ) (2026-05-13T07:55:29Z) - UniMo: Unifying 2D Video and 3D Human Motion with an Autoregressive Framework [54.337290937468175]
統合された枠組み内での2次元映像と3次元映像の協調モデリングのための自己回帰モデルUniMoを提案する。
本手法は,正確なモーションキャプチャを行いながら,対応する映像と動きを同時に生成することを示す。
論文 参考訳(メタデータ) (2025-12-03T16:03:18Z) - Puppeteer: Rig and Animate Your 3D Models [105.11046762553121]
Puppeteerは、さまざまな3Dオブジェクトの自動リギングとアニメーションの両方に対処する包括的なフレームワークである。
本システムはまず, 自己回帰変換器を用いて, 可塑性骨格構造を推定する。
その後、注意に基づくアーキテクチャにより、皮膚の重量を推定する。
論文 参考訳(メタデータ) (2025-08-14T17:59:31Z) - MagicArticulate: Make Your 3D Models Articulation-Ready [109.35703811628045]
静的な3Dモデルを自動的に調音可能なアセットに変換する効果的なフレームワークであるMagicArticulateを提案する。
まず,高品質な調音アノテーションを備えた33k以上の3Dモデルを含むArticulation-averseベンチマークを紹介し,XL-XLから慎重にキュレートする。
大規模な実験では、MagicArticulateはさまざまなオブジェクトカテゴリで既存のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-02-17T18:53:27Z) - Champ: Controllable and Consistent Human Image Animation with 3D Parametric Guidance [25.346255905155424]
本稿では,潜伏拡散フレームワーク内での3次元人間のパラメトリックモデルを活用することで,人間の画像アニメーションの方法論を提案する。
人間の3次元パラメトリックモデルを動作誘導として表現することにより、基準画像と音源映像の動きの間に人体のパラメトリック形状アライメントを行うことができる。
提案手法は,提案した組込みデータセットに対して,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-03-21T18:52:58Z) - Real-time Deep Dynamic Characters [95.5592405831368]
本研究では,高度にリアルな形状,動き,ダイナミックな外観を示す3次元人物モデルを提案する。
我々は,新しいグラフ畳み込みネットワークアーキテクチャを用いて,身体と衣服の運動依存的変形学習を実現する。
本モデルでは, 運動依存的表面変形, 物理的に妥当な動的衣服変形, および映像現実的表面テクスチャを, 従来よりも細部まで高レベルに生成することを示す。
論文 参考訳(メタデータ) (2021-05-04T23:28:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。