論文の概要: GaussiAnimate: Reconstruct and Rig Animatable Categories with Level of Dynamics
- arxiv url: http://arxiv.org/abs/2604.08547v1
- Date: Thu, 09 Apr 2026 17:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:06.084077
- Title: GaussiAnimate: Reconstruct and Rig Animatable Categories with Level of Dynamics
- Title(参考訳): GaussiAnimate: 動的レベルのリコンストラクションとリグアニマタブルカテゴリ
- Authors: Jiaxin Wang, Dongxin Lyu, Zeyu Cai, Zhiyang Dou, Cheng Lin, Anpei Chen, Yuliang Xiu,
- Abstract要約: 我々は「骨格」と呼ばれるaScaffold-Skin Riggingシステムを提案する。
我々は4次元形状のレベルダイナミクスを制御可能かつ表現可能なコンパクトな骨格に圧縮する。
我々は、合成データセットと実世界のデータセットの両方にアプローチを検証する。
- 参考スコア(独自算出の注目度): 33.82354036144774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Free-form bones, that conform closely to the surface, can effectively capture non-rigid deformations, but lack a kinematic structure necessary for intuitive control. Thus, we propose a Scaffold-Skin Rigging System, termed "Skelebones", with three key steps: (1) Bones: compress temporally-consistent deformable Gaussians into free-form bones, approximating non-rigid surface deformations; (2) Skeleton: extract a Mean Curvature Skeleton from canonical Gaussians and refine it temporally, ensuring a category-agnostic, motion-adaptive, and topology-correct kinematic structure; (3) Binding: bind the skeleton and bones via non-parametric partwise motion matching (PartMM), synthesizing novel bone motions by matching, retrieving, and blending existing ones. Collectively, these three steps enable us to compress the Level of Dynamics of 4D shapes into compact skelebones that are both controllable and expressive. We validate our approach on both synthetic and real-world datasets, achieving significant improvements in reanimation performance across unseen poses-with 17.3% PSNR gains over Linear Blend Skinning (LBS) and 21.7% over Bag-of-Bones (BoB)-while maintaining excellent reconstruction fidelity, particularly for characters exhibiting complex non-rigid surface dynamics. Our Partwise Motion Matching algorithm demonstrates strong generalization to both Gaussian and mesh representations, especially under low-data regime (~1000 frames), achieving 48.4% RMSE improvement over robust LBS and outperforming GRU- and MLP-based learning methods by >20%. Code will be made publicly available for research purposes at cookmaker.cn/gaussianimate.
- Abstract(参考訳): 表面に近い自由形骨は、非剛体変形を効果的に捉えることができるが、直感的な制御に必要な運動構造は欠如している。
骨: 時間的に一貫性のある変形可能なガウスを自由形骨に圧縮し、非剛性表面の変形を近似し、(2)スケルトン: 正準ガウスから平均曲率スケルトンを抽出し、時間的に洗練し、カテゴリー非依存的、運動適応的、トポロジ的キネマティック構造を保証し、(3) 結合: 骨と骨を非パラメトリックな部分的マッチング(PartMM)で結合し、マッチング、検索、ブレンディングにより骨の動きを合成する。
これら3つのステップにより、4次元形状のレベル・オブ・ダイナミクスを、制御可能かつ表現可能なコンパクトな骨格に圧縮することができる。
我々は,合成と実世界の両方のデータセットに対するアプローチを検証し,特に複雑な非剛体表面のダイナミクスを示す文字に対して,線形ブレンドスキニング(LBS)よりも17.3%,Bag-of-Bones(BoB)よりも21.7%のPSNRゲインで,未確認のポーズに対する再アニメーション性能の大幅な向上を実現した。
我々のPartwise Motion Matchingアルゴリズムはガウス的およびメッシュ的表現、特に低データ状態(約1000フレーム)下での強力な一般化を示し、ロバストなLBSよりも48.4%のRMSE改善を実現し、GRUおよびMLPに基づく学習手法を20%向上させる。
コードはCookmaker.cn/gaussianimateで研究目的で公開されている。
関連論文リスト
- Stroke3D: Lifting 2D strokes into rigged 3D model via latent diffusion models [53.32092058519587]
Stroke3Dは、ユーザ入力から2D描画ストロークと記述テキストプロンプトを直接生成する新しいフレームワークである。
私たちの知識を最大限に活用するために、私たちの研究は、ユーザ引き起こされた2Dストロークに条件付けされたトリグされた3Dメッシュを初めて生成しました。
論文 参考訳(メタデータ) (2026-02-10T12:17:00Z) - Skin Tokens: A Learned Compact Representation for Unified Autoregressive Rigging [44.79819257609757]
SkinTokensは、スキンウェイトを学習し、コンパクトで、離散的な表現である。
TokenRigは統合された自動回帰フレームワークで、リグ全体を骨格パラメータとSkinTokensの単一シーケンスとしてモデル化する。
我々の研究は、より忠実で堅牢なリギングに統一的で生成的なアプローチを示します。
論文 参考訳(メタデータ) (2026-02-04T17:52:17Z) - SCas4D: Structural Cascaded Optimization for Boosting Persistent 4D Novel View Synthesis [53.10680153186481]
SCas4Dは3次元ガウススプラッティングにおける構造パターンを動的シーンに活用するカスケード最適化フレームワークである。
SCas4Dは、粗い部分レベルから細い点レベルへの変形を段階的に精製することにより、時間フレーム当たり100イテレーション以内の収束を実現する。
このアプローチはまた、自己教師付きオブジェクトセグメンテーション、新しいビュー合成、および高密度点追跡タスクにおける効果を示す。
論文 参考訳(メタデータ) (2025-10-08T06:39:33Z) - From Skin to Skeleton: Towards Biomechanically Accurate 3D Digital Humans [50.014530130312714]
SMPL体モデルに生体力学スケルトンを付加したSKELを開発した。
その結果,SKELはSMPLよりも生体力学的に正確な関節位置を有しており,骨は従来法よりも体表面に収まることがわかった。
論文 参考訳(メタデータ) (2025-09-08T12:24:27Z) - Laplacian Analysis Meets Dynamics Modelling: Gaussian Splatting for 4D Reconstruction [9.911802466255653]
本稿では,ハイブリッドな明示的関数を持つ動的3DGSフレームワークを提案する。
本手法は, 複雑な動的シーンを再構築する際の最先端性能を実証し, 再現精度を向上する。
論文 参考訳(メタデータ) (2025-08-07T01:39:29Z) - PoseGRAF: Geometric-Reinforced Adaptive Fusion for Monocular 3D Human Pose Estimation [5.223657684081615]
既存の単眼的な3次元ポーズ推定法は, 骨格の内在方向と角方向の相関性を見越しながら, 関節位置の特徴に依存している。
これらの課題に対処するためのPoseGRAFフレームワークを提案する。
Human3.6M と MPI-INF-3DHP のデータセットによる実験結果から,本手法が最先端の手法を超えることが示された。
論文 参考訳(メタデータ) (2025-06-17T14:59:56Z) - Overcoming Topology Agnosticism: Enhancing Skeleton-Based Action
Recognition through Redefined Skeletal Topology Awareness [24.83836008577395]
グラフ畳み込みネットワーク(GCN)は長い間、骨格に基づく行動認識の最先端を定義してきた。
彼らはモデルの重みとともに隣接行列を最適化する傾向がある。
このプロセスは、骨接続データの段階的な崩壊を引き起こし、マッピングしようとしたトポロジとは無関係なモデルで終わる。
本稿では,骨の接続性をグラフ距離のパワーを利用して符号化する革新的な経路を提案する。
論文 参考訳(メタデータ) (2023-05-19T06:40:12Z) - Revisiting Skeleton-based Action Recognition [107.08112310075114]
PoseC3Dは骨格に基づく行動認識の新しいアプローチであり、代わりに人間の骨格のベース表現としてグラフシーケンスを積み重ねる3Dヒートマップに依存している。
4つの挑戦的なデータセットにおいて、PoseC3Dは、スケルトン上で単独で使用し、RGBモダリティと組み合わせることで、常に優れたパフォーマンスを得る。
論文 参考訳(メタデータ) (2021-04-28T06:32:17Z) - MotioNet: 3D Human Motion Reconstruction from Monocular Video with
Skeleton Consistency [72.82534577726334]
モノクロビデオから3次元人間の骨格の動きを直接再構成するディープニューラルネットワークであるMotioNetを紹介した。
本手法は,動作表現を完全かつ一般的に使用するキネマティックスケルトンを直接出力する最初のデータ駆動型手法である。
論文 参考訳(メタデータ) (2020-06-22T08:50:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。