論文の概要: Structure-Aware Fine-Grained Gaussian Splatting for Expressive Avatar Reconstruction
- arxiv url: http://arxiv.org/abs/2604.09324v1
- Date: Fri, 10 Apr 2026 13:49:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.890041
- Title: Structure-Aware Fine-Grained Gaussian Splatting for Expressive Avatar Reconstruction
- Title(参考訳): 表現的アバター再建のための微細粒型ガウス切削法
- Authors: Yuze Su, Hongsong Wang, Jie Gui, Liang Wang,
- Abstract要約: 本稿では,モノクロビデオシーケンスから表現力とコヒーレントなフルボディの3次元アバターを再構築する手法を提案する。
本手法では,1段階のトレーニングのみが必要であり,定量評価と定性評価の両方において,最先端のベースラインを上回っている。
- 参考スコア(独自算出の注目度): 27.915439949805876
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reconstructing photorealistic and topology-aware human avatars from monocular videos remains a significant challenge in the fields of computer vision and graphics. While existing 3D human avatar modeling approaches can effectively capture body motion, they often fail to accurately model fine details such as hand movements and facial expressions. To address this, we propose Structure-aware Fine-grained Gaussian Splatting (SFGS), a novel method for reconstructing expressive and coherent full-body 3D human avatars from a monocular video sequence. The SFGS use both spatial-only triplane and time-aware hexplane to capture dynamic features across consecutive frames. A structure-aware gaussian module is designed to capture pose-dependent details in a spatially coherent manner and improve pose and texture expression. To better model hand deformations, we also propose a residual refinement module based on fine-grained hand reconstruction. Our method requires only a single-stage training and outperforms state-of-the-art baselines in both quantitative and qualitative evaluations, generating high-fidelity avatars with natural motion and fine details. The code is on Github: https://github.com/Su245811YZ/SFGS
- Abstract(参考訳): モノクラービデオからフォトリアリスティックでトポロジを意識した人間のアバターを再構築することは、コンピュータビジョンとグラフィックスの分野で重要な課題である。
既存の3D人間のアバターモデリングアプローチは、身体の動きを効果的に捉えることができるが、手の動きや表情のような細部を正確にモデル化することができないことが多い。
そこで本研究では,モノクロビデオシーケンスから表現的かつコヒーレントなフルボディの3次元アバターを再構成する新しい手法である,構造認識型微細ガウス平滑化法(SFGS)を提案する。
SFGSは空間限定三葉機と時間対応六葉機の両方を使用し、連続するフレームをまたいだダイナミックな特徴を捉えている。
構造対応ガウスモジュールは、ポーズ依存の詳細を空間的コヒーレントな方法で捉え、ポーズとテクスチャ表現を改善するように設計されている。
また, 手の変形をモデル化するために, きめ細かな手再構成に基づく残差改善モジュールを提案する。
本手法は,1段階のトレーニングのみを必要とし,定量評価と定性評価の両方において最先端のベースラインを上回り,自然運動と細かな細部を有する高忠実なアバターを生成する。
コードはGithubにある。 https://github.com/Su245811YZ/SFGS
関連論文リスト
- MPMAvatar: Learning 3D Gaussian Avatars with Accurate and Robust Physics-Based Dynamics [27.63650397876897]
MPMAvatarは、マルチビュービデオから3Dヒューマンアバターを作成するためのフレームワークである。
高精度でロバストな動的モデリングのために、我々はMaterial Point Methodベースのシミュレータを使う。
論文 参考訳(メタデータ) (2025-10-02T02:51:45Z) - EVA: Expressive Virtual Avatars from Multi-view Videos [51.33851869426057]
本稿では,アクター固有の,完全に制御可能な,表現力のある人間のアバターフレームワークであるExpressive Virtual Avatars (EVA)を紹介する。
EVAは、表情、身体の動き、手の動きの独立的な制御を可能にしながら、高忠実でライフライクなレンダリングをリアルタイムで実現している。
この研究は、完全に乾燥可能なデジタル人間モデルに向けた大きな進歩を示している。
論文 参考訳(メタデータ) (2025-05-21T11:22:52Z) - TeGA: Texture Space Gaussian Avatars for High-Resolution Dynamic Head Modeling [52.87836237427514]
フォトリアルアバターは、テレプレゼンス、拡張現実、エンターテイメントにおける新興アプリケーションにおいて重要な要素であると見なされている。
本稿では,最先端の3Dヘッドアバターモデルを提案する。
論文 参考訳(メタデータ) (2025-05-08T22:10:27Z) - FRESA: Feedforward Reconstruction of Personalized Skinned Avatars from Few Images [74.86864398919467]
数枚の画像からリアルなアニメーションで、パーソナライズされた3Dアバターを再構成する新しい手法を提案する。
我々は、1000人以上の服を着た人間から普遍的な事前学習を行い、即時フィードフォワード生成とゼロショット一般化を実現する。
提案手法は, 最新技術よりも忠実な再構築とアニメーションを生成し, カジュアルに撮影された携帯電話写真からの入力に直接一般化することができる。
論文 参考訳(メタデータ) (2025-03-24T23:20:47Z) - RMAvatar: Photorealistic Human Avatar Reconstruction from Monocular Video Based on Rectified Mesh-embedded Gaussians [17.99475480217687]
モノクロビデオからアバターを学習するために、メッシュ上にガウススプラッティングを組み込んだ新しい人間のアバター表現であるRMAvatarを紹介した。
明示的なメッシュ幾何を用いて仮想人間の動きと形状を表現し、ガウススプラッティングによる暗黙の外観レンダリングを行う。
RMAvatarは、レンダリング品質と定量的評価の両方について最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-01-13T07:32:44Z) - AniGS: Animatable Gaussian Avatar from a Single Image with Inconsistent Gaussian Reconstruction [26.82525451095629]
本稿では,不整合画像の3次元再構成のためのロバストな手法を提案し,推論中のリアルタイムレンダリングを実現する。
再建問題を4次元課題として再検討し, 4次元ガウススプラッティングを用いた効率的な3次元モデリング手法を提案する。
実験により,本手法は3次元人体アバターの光実写・リアルタイムアニメーションを実現する。
論文 参考訳(メタデータ) (2024-12-03T18:55:39Z) - Sequential Gaussian Avatars with Hierarchical Motion Context [7.6736633105043515]
SMPLで駆動される3DGSのヒトアバターは、フィット中のポーズから外観への複雑なマッピングにより、外観の細部を捉えるのに苦労する。
階層的な動きコンテキストに基づいて,人間のアバターをより良くモデル化するために,明示的な3DGS表現を探索するSeqAvatarを提案する。
提案手法は3DGSによるアプローチよりも優れており,最新のNeRFモデルよりも桁違いに高速に人間のアバターをレンダリングする。
論文 参考訳(メタデータ) (2024-11-25T04:05:19Z) - Generalizable and Animatable Gaussian Head Avatar [50.34788590904843]
本稿では,GAGAvatar(Generalizable and Animatable Gaussian Head Avatar)を提案する。
我々は、1つの前方通過で1つの画像から3次元ガウスのパラメータを生成する。
提案手法は, 従来の手法と比較して, 再現性や表現精度の点で優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-10T14:29:00Z) - Deformable 3D Gaussian Splatting for Animatable Human Avatars [50.61374254699761]
本稿では,デジタルアバターを単一単分子配列で構築する手法を提案する。
ParDy-Humanは、リアルなダイナミックな人間のアバターの明示的なモデルを構成する。
当社のアバター学習には,Splatマスクなどの追加アノテーションが不要であり,ユーザのハードウェア上でも,フル解像度の画像を効率的に推測しながら,さまざまなバックグラウンドでトレーニングすることが可能である。
論文 参考訳(メタデータ) (2023-12-22T20:56:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。