論文の概要: Rigel3D: Rig-aware Latents for Animation-Ready 3D Asset Generation
- arxiv url: http://arxiv.org/abs/2605.13129v1
- Date: Wed, 13 May 2026 07:55:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.88494
- Title: Rigel3D: Rig-aware Latents for Animation-Ready 3D Asset Generation
- Title(参考訳): Rigel3D:アニメーション対応の3Dアセットジェネレータ
- Authors: Nikitas Chatzis, Marios Loizou, Evangelos Kalogerakis,
- Abstract要約: Rigel3Dはアニメーション対応の3Dアセットをリップメッシュとして生成する方法である。
rig対応オートエンコーダは、これらの表現をメッシュ幾何学、骨格位相、関節座標、スキンウェイトにデコードする。
2段階の潜伏生成モデルは、画像条件付き生成のための表面表現と骨格表現の両方を合成する。
- 参考スコア(独自算出の注目度): 6.821657791615377
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent 3D generative models can synthesize high-quality assets, but their outputs are typically static: they lack the skeletal rigs, joint hierarchies, and skinning weights required for animation. This limits their use in games, film, simulation, virtual agents, and embodied AI, where assets must not only look plausible but also move plausibly. We introduce Rigel3D, a generative method for animation-ready 3D assets represented as rigged meshes. Unlike post-hoc auto-rigging methods that attach rigs to completed shapes, our method jointly models geometry and rig structure through coupled surface and skeleton structured latent representations. A rig-aware autoencoder decodes these representations into mesh geometry, skeleton topology, joint coordinates, and skinning weights, while a two-stage latent generative model synthesizes both surface and skeleton representations for image-conditioned generation. To support downstream animation workflows, we further introduce an open-vocabulary joint labeling module that embeds generated joints into a shared vision-language space, enabling correspondence to arbitrary retargeting templates. Experiments on large-scale rigged asset datasets demonstrate that our method generates diverse, high-quality animation-ready assets and outperforms existing rigging baselines across multiple metrics.
- Abstract(参考訳): 最近の3D生成モデルは高品質な資産を合成することができるが、その出力は通常静的である。
これにより、ゲーム、映画、シミュレーション、仮想エージェント、そして具体化されたAIでの使用が制限される。
本稿では,リッグメッシュとして表現されたアニメーション対応3Dアセットの生成方法であるRigel3Dを紹介する。
完成した形状にリグを付加するポストホック自動リグ法とは異なり,本手法は,結合した表面と骨格構造を有する潜在表現を通して,幾何学とリグ構造を共同でモデル化する。
rig対応オートエンコーダは、これらの表現をメッシュ幾何学、骨格トポロジ、関節座標、およびスキンウェイトにデコードし、2段階ラテント生成モデルは、画像条件付き生成のための表面および骨格表現を合成する。
下流のアニメーションワークフローをサポートするために、生成したジョイントを共有視覚空間に埋め込んだオープン語彙のジョイントラベリングモジュールを導入し、任意の再ターゲットテンプレートへの対応を可能にする。
大規模リギング・アセット・データセットの実験により,本手法は多種多様な高品質のアニメーション・レディ・アセットを生成し,既存のリギング・ベースラインを複数の指標で上回る性能を示した。
関連論文リスト
- AniGen: Unified $S^3$ Fields for Animatable 3D Asset Generation [64.1405325883561]
AniGenは、単一画像上に条件付きアニメーション対応の3Dアセットを直接生成する統合フレームワークである。
私たちの重要な洞察は、共有空間領域上で定義されたS3$ Fields(Shape, Skeleton, Skin)として、形状、骨格、スキン化を表現することです。
AniGenは、リグの妥当性とアニメーションの品質において、最先端のシーケンシャルベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2026-04-09T20:22:06Z) - ArtLLM: Generating Articulated Assets via 3D LLM [19.814132638278547]
ArtLLMは、完全な3Dメッシュから直接高品質な調音資産を生成するための新しいフレームワークである。
コアとなるのは,大規模な調音データセットに基づいてトレーニングされた,3Dマルチモーダルな大規模言語モデルだ。
実験の結果,ArtLLMは部品配置精度と接合予測の両方で最先端の手法を著しく上回ることがわかった。
論文 参考訳(メタデータ) (2026-03-01T15:07:46Z) - Stroke3D: Lifting 2D strokes into rigged 3D model via latent diffusion models [53.32092058519587]
Stroke3Dは、ユーザ入力から2D描画ストロークと記述テキストプロンプトを直接生成する新しいフレームワークである。
私たちの知識を最大限に活用するために、私たちの研究は、ユーザ引き起こされた2Dストロークに条件付けされたトリグされた3Dメッシュを初めて生成しました。
論文 参考訳(メタデータ) (2026-02-10T12:17:00Z) - Puppeteer: Rig and Animate Your 3D Models [105.11046762553121]
Puppeteerは、さまざまな3Dオブジェクトの自動リギングとアニメーションの両方に対処する包括的なフレームワークである。
本システムはまず, 自己回帰変換器を用いて, 可塑性骨格構造を推定する。
その後、注意に基づくアーキテクチャにより、皮膚の重量を推定する。
論文 参考訳(メタデータ) (2025-08-14T17:59:31Z) - AutoDecoding Latent 3D Diffusion Models [95.7279510847827]
本稿では,3次元オートデコーダをコアとした静的・明瞭な3次元アセットの生成に対して,新しいアプローチを提案する。
3D Autodecoderフレームワークは、ターゲットデータセットから学んだプロパティを潜時空間に埋め込む。
次に、適切な中間体積潜在空間を特定し、ロバストな正規化と非正規化演算を導入する。
論文 参考訳(メタデータ) (2023-07-07T17:59:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。