論文の概要: Splatshot: 3D Face Avatar Generation from a Single Unconstrained Photo
- arxiv url: http://arxiv.org/abs/2606.01493v1
- Date: Sun, 31 May 2026 23:19:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.734372
- Title: Splatshot: 3D Face Avatar Generation from a Single Unconstrained Photo
- Title(参考訳): Splatshot:1枚の制約のない写真から3D顔アバターを生成
- Authors: Hao Liang, Zhixuan Ge, Soumendu Majee, Joanna Li, Ashok Veeraraghavan, Guha Balakrishnan,
- Abstract要約: SplatShot(SplatShot)は,3D表現を記述プロセス内で直接結合する,トレーニング不要のフレームワークである。
SplatShotは3Dアバターを製作し、優れたアイデンティティ保存、フォトリアリズム、マルチビュー整合性を示す。
- 参考スコア(独自算出の注目度): 22.10478800887373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reconstructing a photorealistic 3D face avatar from a single unconstrained photograph is challenging: feed-forward 3D Gaussian Splatting (3DGS) models degrade on out-of-distribution inputs, while pretrained diffusion models produce high-fidelity images but lack multi-view consistency. We observe that these paradigms are fundamentally complementary: explicit 3D representations guarantee geometric consistency, whereas 2D diffusion priors ensure photorealism. Building on this, we propose SplatShot, a training-free framework that couples these representations directly within the denoising process. Given a base 3DGS face model and a single reference image, we jointly denoise all target views using a per-step 3D feedback loop. At each timestep, we predict clean images from the noisy latents, refit the 3DGS to these multi-view predictions, and back-propagate the photometric discrepancy between the 3DGS re-renderings and 2D predictions into the noise estimate. This steers the sampling trajectory toward strictly 3D-coherent, identity-faithful outputs. Experiments on diverse in-the-wild images demonstrate that SplatShot produces 3D avatars with superior identity preservation, photorealism, and multi-view consistency.
- Abstract(参考訳): フィードフォワード3Dガウススプラッティング(3DGS)モデルは、分布外の入力で劣化し、事前訓練された拡散モデルは高忠実度画像を生成するが、マルチビューの整合性が欠如している。
これらのパラダイムは基本的に相補的であり、明示的な3次元表現は幾何的整合性を保証する。
これに基づいて,これらの表現を記述プロセス内で直接結合する,トレーニング不要のフレームワークであるSplatShotを提案する。
ベースとなる3DGSの顔モデルと単一の参照画像が与えられた場合、ステップごとの3Dフィードバックループを用いて、全てのターゲットビューを共同で識別する。
各段階において、ノイズの多い潜伏者からのクリーンな画像を予測し、3DGSをこれらのマルチビュー予測に適合させ、3DGSの再レンダリングと2D予測との間の光度差をノイズ推定にバックプロパガントする。
これにより、厳密な3Dコヒーレントでアイデンティティに忠実な出力へのサンプリング軌道が導かれる。
SplatShotは3Dアバターを製作し、優れたアイデンティティ保存、フォトリアリズム、マルチビュー整合性を示す。
関連論文リスト
- UMAMI: Unifying Masked Autoregressive Models and Deterministic Rendering for View Synthesis [28.245380116188883]
新たなビュー合成(NVS)は、シーンの写実的で3D一貫性のある画像を、未確認のカメラのポーズからレンダリングすることを目的としている。
既存の決定論的ネットワークは、観測された領域を素早くレンダリングするが、観測されていない領域をぼかす。
両パラダイムの長所を統一するハイブリッドフレームワークを提案する。双方向トランスフォーマーは多視点画像トークンとプルッカー線埋め込みを符号化し、共有潜在表現を生成する。
論文 参考訳(メタデータ) (2025-12-23T07:08:00Z) - MoGA: 3D Generative Avatar Prior for Monocular Gaussian Avatar Reconstruction [65.5412504339528]
MoGAは高忠実度3Dガウスアバターを単一視点画像から再構成する新しい手法である。
提案手法は最先端の手法を超越し,実世界のシナリオを一般化する。
論文 参考訳(メタデータ) (2025-07-31T14:36:24Z) - DSplats: 3D Generation by Denoising Splats-Based Multiview Diffusion Models [67.50989119438508]
本稿では,ガウスをベースとしたレコンストラクタを用いて,リアルな3Dアセットを生成することで,マルチビュー画像を直接認識するDSplatを紹介した。
実験の結果,DSplatsは高品質で空間的に一貫した出力を生成できるだけでなく,単一画像から3次元再構成への新たな標準も設定できることがわかった。
論文 参考訳(メタデータ) (2024-12-11T07:32:17Z) - GSD: View-Guided Gaussian Splatting Diffusion for 3D Reconstruction [52.04103235260539]
単一視点からの3次元オブジェクト再構成のためのガウススプティング表現に基づく拡散モデル手法を提案する。
モデルはGS楕円体の集合で表される3Dオブジェクトを生成することを学習する。
最終的な再構成されたオブジェクトは、高品質な3D構造とテクスチャを持ち、任意のビューで効率的にレンダリングできる。
論文 参考訳(メタデータ) (2024-07-05T03:43:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。