論文の概要: Better Rigs, Not Bigger Networks: A Body Model Ablation for Gaussian Avatars
- arxiv url: http://arxiv.org/abs/2604.01447v1
- Date: Wed, 01 Apr 2026 22:42:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.089171
- Title: Better Rigs, Not Bigger Networks: A Body Model Ablation for Gaussian Avatars
- Title(参考訳): ガウスアバターのボディモデルアブレーション
- Authors: Derek Austin,
- Abstract要約: SMPLをMHR(Momentum Human Rig)に置き換える
ボディーモデル表現能力からポーズ推定品質を乱すための2つの制御されたアブリケーションを実行する。
これらのアブリゲーションは、ボディモデルがアバター再構成の主要なボトルネックであり、メッシュ表現能力と推定品質の両方がパイプライン全体のゲインに有意義に寄与していることを確認している。
- 参考スコア(独自算出の注目度): 1.066048003460524
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent 3D Gaussian splatting methods built atop SMPL achieve remarkable visual fidelity while continually increasing the complexity of the overall training architecture. We demonstrate that much of this complexity is unnecessary: by replacing SMPL with the Momentum Human Rig (MHR), estimated via SAM-3D-Body, a minimal pipeline with no learned deformations or pose-dependent corrections achieves the highest reported PSNR and competitive or superior LPIPS and SSIM on PeopleSnapshot and ZJU-MoCap. To disentangle pose estimation quality from body model representational capacity, we perform two controlled ablations: translating SAM-3D-Body meshes to SMPL-X, and translating the original dataset's SMPL poses into MHR both retrained under identical conditions. These ablations confirm that body model expressiveness has been a primary bottleneck in avatar reconstruction, with both mesh representational capacity and pose estimation quality contributing meaningfully to the full pipeline's gains.
- Abstract(参考訳): SMPL上に構築された最近の3次元ガウススプラッティング法は、全体的なトレーニングアーキテクチャの複雑さを継続的に増大させながら、目覚しい視覚的忠実性を実現している。
SMPL を Momentum Human Rig (MHR) に置き換えることで、SAM-3D-Body で推定される最小のパイプラインで、学習された変形やポーズ依存の補正を行なわず、最も報告されたPSNRを達成し、PeopleSnapshot と ZJU-MoCap 上でLPIPS と SSIM を競い合うことができる。
身体モデル表現能力からポーズ推定品質を逸脱させるため、SAM-3D-BodyメッシュをSMPL-Xに翻訳し、元のデータセットのSMPLポーズをMHRに翻訳する。
これらのアブリゲーションは、アバター再構成におけるボディモデル表現性が主要なボトルネックであり、メッシュ表現能力と推定品質の両方がパイプライン全体のゲインに有意義に寄与していることを確認している。
関連論文リスト
- SOMA: Unifying Parametric Human Body Models [47.381120553445136]
パラメトリックな人体モデルは、人間の再構築、アニメーション、シミュレーションの基礎となっているが、それらは相互に相容れないままである。
これらの異種表現を3つの抽象層を通して変換する統一体層であるSOMAを提案する。
パイプライン全体は完全に差別化可能で、NVIDIA-Warp経由でGPUを加速する。
論文 参考訳(メタデータ) (2026-03-17T17:58:03Z) - M^3: Dense Matching Meets Multi-View Foundation Models for Monocular Gaussian Splatting SLAM [36.28718478194476]
M3はMulti-view基盤モデルを専用のMatchingヘッドで拡張し、細粒度の密度の高い通信を容易にする。
室内および屋外の様々なベンチマークの実験は、ポーズ推定とシーン再構成の両方において最先端の精度を示している。
論文 参考訳(メタデータ) (2026-03-17T17:52:37Z) - FreeSplatter: Pose-free Gaussian Splatting for Sparse-view 3D Reconstruction [69.63414788486578]
FreeSplatterはスケーラブルなフィードフォワードフレームワークで、キャリブレーションされていないスパースビュー画像から高品質な3Dガウシアンを生成する。
当社のアプローチでは,自己注意ブロックが情報交換を容易にする合理化トランスフォーマーアーキテクチャを採用している。
包括的データセットに基づいて,オブジェクト中心とシーンレベルの再構築のための2つの特殊な変種を開発する。
論文 参考訳(メタデータ) (2024-12-12T18:52:53Z) - MVGamba: Unify 3D Content Generation as State Space Sequence Modeling [150.80564081817786]
本稿では,多視点ガウス再構成器を備えた一般軽量ガウス再構成モデルMVGambaを紹介する。
オフザディテールのマルチビュー拡散モデルを統合することで、MVGambaは単一の画像、スパース画像、テキストプロンプトから3D生成タスクを統一する。
実験により、MVGambaは、すべての3Dコンテンツ生成シナリオで最先端のベースラインを約0.1タイムのモデルサイズで上回ります。
論文 参考訳(メタデータ) (2024-06-10T15:26:48Z) - SMPLer: Taming Transformers for Monocular 3D Human Shape and Pose Estimation [74.07836010698801]
この問題に対処するために,SMPLベースのトランスフォーマーフレームワーク(SMPLer)を提案する。
SMPLerは、切り離された注意操作とSMPLベースのターゲット表現の2つの重要な要素を組み込んでいる。
SMPLerの既存の3次元人体形状に対する効果とポーズ推定方法の実証実験を行った。
論文 参考訳(メタデータ) (2024-04-23T17:59:59Z) - GVA: Reconstructing Vivid 3D Gaussian Avatars from Monocular Videos [56.40776739573832]
モノクロビデオ入力(GVA)から鮮明な3Dガウスアバターの作成を容易にする新しい手法を提案する。
私たちのイノベーションは、高忠実な人体再構築を実現するという、複雑な課題に対処することにあります。
通常の地図とシルエットを整列させて手足のポーズ精度を向上させるためにポーズ改善手法を提案する。
論文 参考訳(メタデータ) (2024-02-26T14:40:15Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z) - Adversarial Parametric Pose Prior [106.12437086990853]
我々は、SMPLパラメータを現実的なポーズを生成する値に制限する事前学習を行う。
得られた先行学習は実データ分布の多様性をカバーし、2次元キーポイントからの3次元再構成の最適化を容易にし、画像からの回帰に使用する場合のポーズ推定精度を向上することを示す。
論文 参考訳(メタデータ) (2021-12-08T10:05:32Z) - PaMIR: Parametric Model-Conditioned Implicit Representation for
Image-based Human Reconstruction [67.08350202974434]
本研究では,パラメトリックボディモデルと自由形深部暗黙関数を組み合わせたパラメトリックモデル記述型暗黙表現(PaMIR)を提案する。
本手法は, 挑戦的なポーズや衣料品のタイプにおいて, 画像に基づく3次元再構築のための最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-08T02:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。