論文の概要: Parametric Gaussian Human Model: Generalizable Prior for Efficient and Realistic Human Avatar Modeling
- arxiv url: http://arxiv.org/abs/2506.06645v1
- Date: Sat, 07 Jun 2025 03:53:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.376458
- Title: Parametric Gaussian Human Model: Generalizable Prior for Efficient and Realistic Human Avatar Modeling
- Title(参考訳): パラメトリックガウス型人間モデル:効率的で現実的な人間のアバターモデリングのための一般化可能な優先順位
- Authors: Cheng Peng, Jingxiang Sun, Yushuo Chen, Zhaoqi Su, Zhuo Su, Yebin Liu,
- Abstract要約: フォトとアニマタブルな人間のアバターは、バーチャル/拡張現実、テレプレゼンス、デジタルエンターテイメントの鍵となる。
本稿では,人間を3DGSに統合する汎用的で効率的なフレームワークであるParametric Gaussian Human Model(PGHM)を提案する。
実験の結果、PGHMは最適化からスクラッチまでの手法よりもはるかに効率が良く、1被写体あたり約20分で同等の視覚的品質のアバターを生産できることがわかった。
- 参考スコア(独自算出の注目度): 32.480049588166544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photorealistic and animatable human avatars are a key enabler for virtual/augmented reality, telepresence, and digital entertainment. While recent advances in 3D Gaussian Splatting (3DGS) have greatly improved rendering quality and efficiency, existing methods still face fundamental challenges, including time-consuming per-subject optimization and poor generalization under sparse monocular inputs. In this work, we present the Parametric Gaussian Human Model (PGHM), a generalizable and efficient framework that integrates human priors into 3DGS for fast and high-fidelity avatar reconstruction from monocular videos. PGHM introduces two core components: (1) a UV-aligned latent identity map that compactly encodes subject-specific geometry and appearance into a learnable feature tensor; and (2) a disentangled Multi-Head U-Net that predicts Gaussian attributes by decomposing static, pose-dependent, and view-dependent components via conditioned decoders. This design enables robust rendering quality under challenging poses and viewpoints, while allowing efficient subject adaptation without requiring multi-view capture or long optimization time. Experiments show that PGHM is significantly more efficient than optimization-from-scratch methods, requiring only approximately 20 minutes per subject to produce avatars with comparable visual quality, thereby demonstrating its practical applicability for real-world monocular avatar creation.
- Abstract(参考訳): フォトリアリスティックでアニマタブルな人間のアバターは、バーチャル/拡張現実、テレプレゼンス、デジタルエンターテイメントの鍵となる。
近年の3Dガウス・スプレイティング(3DGS)の進歩はレンダリング品質と効率を大幅に向上させたが、既存の手法は、オブジェクトごとの時間消費最適化や、スパース単分子入力による一般化の低さなど、基本的な課題に直面している。
本研究では,モノクロビデオから高速かつ高忠実なアバター再構成を実現するために,ヒトの前駆体を3DGSに統合する汎用的で効率的なフレームワークであるParametric Gaussian Human Model (PGHM)を提案する。
PGHMは,(1)主観的幾何学と外観を学習可能な特徴テンソルにコンパクトにエンコードするUVアライン潜在アイデンティティマップ,(2)静的・ポーズ依存・ビュー依存のコンポーネントを条件付きデコーダで分解することでガウス属性を予測するアンタングル型マルチヘッドU-Netの2つのコアコンポーネントを導入している。
この設計により、困難なポーズや視点の下で堅牢なレンダリング品質を実現すると同時に、多視点キャプチャや長い最適化時間を必要としない効率的な対象適応が可能となる。
実験により、PGHMは最適化・ゼロ・スクラッチ法よりもはるかに効率が良く、1被写体あたり約20分で同等の視覚的品質のアバターを生産できることが示され、現実世界のモノクロアバター作成に実用的適用性を示す。
関連論文リスト
- EVA: Expressive Virtual Avatars from Multi-view Videos [51.33851869426057]
本稿では,アクター固有の,完全に制御可能な,表現力のある人間のアバターフレームワークであるExpressive Virtual Avatars (EVA)を紹介する。
EVAは、表情、身体の動き、手の動きの独立的な制御を可能にしながら、高忠実でライフライクなレンダリングをリアルタイムで実現している。
この研究は、完全に乾燥可能なデジタル人間モデルに向けた大きな進歩を示している。
論文 参考訳(メタデータ) (2025-05-21T11:22:52Z) - SEGA: Drivable 3D Gaussian Head Avatar from a Single Image [15.117619290414064]
本稿では,3次元ドライビング可能なガウスヘッドアバターの新規な手法であるSEGAを提案する。
SEGAは、大規模な2Dデータセットから派生した先行データと、マルチビュー、マルチ圧縮、マルチIDデータから得られた3D先行データとをシームレスに結合する。
提案手法は, 一般化能力, アイデンティティ保存, 表現リアリズムにおいて, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-19T18:23:31Z) - GPHM: Gaussian Parametric Head Model for Monocular Head Avatar Reconstruction [47.113910048252805]
高忠実度3D人間の頭部アバターは、VR/AR、デジタル人間、映画製作に不可欠である。
近年の進歩は、変形可能な顔モデルを利用して、様々なアイデンティティと表現を表現するアニメーションヘッドアバターを生成している。
本稿では,人間の頭部の複雑さを正確に表現するために,三次元ガウスを用いた3次元ガウスパラメトリックヘッドモデルを提案する。
論文 参考訳(メタデータ) (2024-07-21T06:03:11Z) - Expressive Gaussian Human Avatars from Monocular RGB Video [69.56388194249942]
EVAは3DガウスとSMPL-Xに基づいて細部を巧みに彫刻する乾燥可能な人間モデルである。
SMPL-XモデルをRGBフレームに整合させることが,効果的なアバター学習において重要であることを強調した。
本稿では,勾配閾値を適応的に調整する適応密度制御戦略を提案する。
論文 参考訳(メタデータ) (2024-07-03T15:36:27Z) - NPGA: Neural Parametric Gaussian Avatars [46.52887358194364]
マルチビュー映像記録から高忠実度制御可能なアバターを作成するためのデータ駆動方式を提案する。
我々は,高効率なレンダリングのための3次元ガウススプラッティングの手法を構築し,点雲のトポロジカルな柔軟性を継承する。
提案手法をNeRSembleデータセット上で評価し,NPGAが従来の自己再現タスクの2.6PSNRよりも有意に優れていたことを示す。
論文 参考訳(メタデータ) (2024-05-29T17:58:09Z) - GoMAvatar: Efficient Animatable Human Modeling from Monocular Video Using Gaussians-on-Mesh [97.47701169876272]
GoMAvatarは、リアルタイム、メモリ効率、高品質な人間のモデリングのための新しいアプローチである。
GoMAvatarは、レンダリング品質において、現在のモノラルな人間のモデリングアルゴリズムにマッチするか、上回っている。
論文 参考訳(メタデータ) (2024-04-11T17:59:57Z) - GaussianAvatar: Towards Realistic Human Avatar Modeling from a Single Video via Animatable 3D Gaussians [51.46168990249278]
一つのビデオから動的に3D映像を映し出すリアルな人間のアバターを作成するための効率的なアプローチを提案する。
GustafAvatarは、公開データセットと収集データセットの両方で検証されています。
論文 参考訳(メタデータ) (2023-12-04T18:55:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。