論文の概要: DipGuava: Disentangling Personalized Gaussian Features for 3D Head Avatars from Monocular Video
- arxiv url: http://arxiv.org/abs/2603.28003v1
- Date: Mon, 30 Mar 2026 03:50:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.218837
- Title: DipGuava: Disentangling Personalized Gaussian Features for 3D Head Avatars from Monocular Video
- Title(参考訳): DipGuava:モノクロビデオから3Dヘッドアバターのパーソナライズされたガウス的特徴を識別する
- Authors: Jeonghaeng Lee, Seok Keun Choi, Zhixuan Li, Weisi Lin, Sanghoon Lee,
- Abstract要約: DipGuavaは、モノクロビデオからパーソナライズされた属性を持つアバターを生成する新しい3Dガウスの頭部アバター作成方法である。
顔の外観を2つの相補的な構成要素に明示的に切り離し、構造化された2段階のパイプラインで訓練する最初の方法である。
広汎な実験で示されるように、視覚的品質と量的性能の両方において、従来手法よりも一貫して優れていた。
- 参考スコア(独自算出の注目度): 56.39805581764342
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While recent 3D head avatar creation methods attempt to animate facial dynamics, they often fail to capture personalized details, limiting realism and expressiveness. To fill this gap, we present DipGuava (Disentangled and Personalized Gaussian UV Avatar), a novel 3D Gaussian head avatar creation method that successfully generates avatars with personalized attributes from monocular video. DipGuava is the first method to explicitly disentangle facial appearance into two complementary components, trained in a structured two-stage pipeline that significantly reduces learning ambiguity and enhances reconstruction fidelity. In the first stage, we learn a stable geometry-driven base appearance that captures global facial structure and coarse expression-dependent variations. In the second stage, the personalized residual details not captured in the first stage are predicted, including high-frequency components and nonlinearly varying features such as wrinkles and subtle skin deformations. These components are fused via dynamic appearance fusion that integrates residual details after deformation, ensuring spatial and semantic alignment. This disentangled design enables DipGuava to generate photorealistic, identity-preserving avatars, consistently outperforming prior methods in both visual quality and quantitativeperformance, as demonstrated in extensive experiments.
- Abstract(参考訳): 最近の3Dヘッドアバター作成法は、顔のダイナミクスをアニメーション化しようとするが、パーソナライズされた詳細をキャプチャできず、リアリズムと表現性を制限している。
このギャップを埋めるためにDipGuava (Disentangled and Personalized Gaussian UV Avatar)を提案する。
DipGuavaは、顔の外観を2つの相補的なコンポーネントに明示的に切り離す最初の方法であり、構造化された2段階のパイプラインで訓練され、学習のあいまいさを著しく低減し、再構築の忠実さを高める。
第1段階では,グローバルな顔構造と粗い表情依存の変動を捉えた,安定な幾何駆動型ベース外観を学習する。
第2段階では、高周波成分やシワや微妙な皮膚変形など非線形に変化する特徴を含む、第1段階で捉えないパーソナライズされた残留詳細を予測する。
これらの成分は動的外観融合によって融合され、変形後の残留詳細を統合し、空間的および意味的なアライメントを確保する。
この不整合設計により、DipGuavaはフォトリアリスティックでアイデンティティを保存するアバターを生成でき、広範囲な実験で示されるように、視覚的品質と量的性能の両方において、従来手法よりも一貫して優れていた。
関連論文リスト
- Capture, Canonicalize, Splat: Zero-Shot 3D Gaussian Avatars from Unstructured Phone Images [20.85870756824163]
キャプチャー、カノニカライズ、Splat」パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的四角形アバターを生産する。
この"Capture, Canonicalize, Splat"パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的な四角形アバターを生成する。
論文 参考訳(メタデータ) (2025-10-15T20:36:28Z) - AvatarBack: Back-Head Generation for Complete 3D Avatars from Front-View Images [24.909494214820324]
AvatarBackは、完全で一貫性のある3Dガウスアバターを再構成するように設計された、新しいプラグイン・アンド・プレイフレームワークである。
AvatarBackは,前頭骨の忠実度を維持しつつ,背頭再建の質を著しく向上させることを示す。
再建されたアバターは多様な動きの下で一貫した視覚的リアリズムを維持し、完全にアニマタブルである。
論文 参考訳(メタデータ) (2025-08-28T10:15:38Z) - MoGA: 3D Generative Avatar Prior for Monocular Gaussian Avatar Reconstruction [65.5412504339528]
MoGAは高忠実度3Dガウスアバターを単一視点画像から再構成する新しい手法である。
提案手法は最先端の手法を超越し,実世界のシナリオを一般化する。
論文 参考訳(メタデータ) (2025-07-31T14:36:24Z) - FRESA: Feedforward Reconstruction of Personalized Skinned Avatars from Few Images [74.86864398919467]
数枚の画像からリアルなアニメーションで、パーソナライズされた3Dアバターを再構成する新しい手法を提案する。
我々は、1000人以上の服を着た人間から普遍的な事前学習を行い、即時フィードフォワード生成とゼロショット一般化を実現する。
提案手法は, 最新技術よりも忠実な再構築とアニメーションを生成し, カジュアルに撮影された携帯電話写真からの入力に直接一般化することができる。
論文 参考訳(メタデータ) (2025-03-24T23:20:47Z) - Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance [69.9745497000557]
本稿では,人間の顔の基盤モデルを用いた最初のSDSベースの手法であるArc2Avatarについて述べる。
我々のアバターは人間の顔メッシュテンプレートとの密接な対応を維持しており、ブレンドシェープによる表現生成を可能にしている。
論文 参考訳(メタデータ) (2025-01-09T17:04:33Z) - PERSE: Personalized 3D Generative Avatars from A Single Portrait [18.069177711777662]
PERSEは、参照ポートレートからパーソナライズされた3D生成アバターを構築する方法である。
提案手法は,大規模な合成2Dビデオデータセットから始まる。
論文 参考訳(メタデータ) (2024-12-30T18:59:58Z) - Generalizable One-shot Neural Head Avatar [90.50492165284724]
本研究では,1枚の画像から3次元頭部アバターを再構成し,アニメイトする手法を提案する。
本研究では,一視点画像に基づく識別不能な人物を一般化するだけでなく,顔領域内外における特徴的詳細を捉えるフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-14T22:33:09Z) - AvatarCap: Animatable Avatar Conditioned Monocular Human Volumetric
Capture [36.10436374741757]
AvatarCapは、目に見える領域と見えない領域の両方で高忠実な再構築のために、キャプチャパイプラインにアニマタブルなアバターを導入する、新しいフレームワークである。
本手法は, 画像観察とアバターの両方からの情報を統合し, 高忠実度3次元テクスチャモデルを視認性に関係なく動的に再構成する。
論文 参考訳(メタデータ) (2022-07-05T13:21:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。