論文の概要: Capture, Canonicalize, Splat: Zero-Shot 3D Gaussian Avatars from Unstructured Phone Images
- arxiv url: http://arxiv.org/abs/2510.14081v1
- Date: Wed, 15 Oct 2025 20:36:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.611779
- Title: Capture, Canonicalize, Splat: Zero-Shot 3D Gaussian Avatars from Unstructured Phone Images
- Title(参考訳): ゼロショット3Dガウスアバター(動画あり)
- Authors: Emanuel Garbin, Guy Adam, Oded Krams, Zohar Barzelay, Eran Guendelman, Michael Schwarz, Moran Vatelmacher, Yigal Shenkman, Eli Peker, Itai Druker, Uri Patish, Yoav Blum, Max Bluvstein, Junxuan Li, Rawal Khirodkar, Shunsuke Saito,
- Abstract要約: キャプチャー、カノニカライズ、Splat」パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的四角形アバターを生産する。
この"Capture, Canonicalize, Splat"パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的な四角形アバターを生成する。
- 参考スコア(独自算出の注目度): 21.22928353550581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel, zero-shot pipeline for creating hyperrealistic, identity-preserving 3D avatars from a few unstructured phone images. Existing methods face several challenges: single-view approaches suffer from geometric inconsistencies and hallucinations, degrading identity preservation, while models trained on synthetic data fail to capture high-frequency details like skin wrinkles and fine hair, limiting realism. Our method introduces two key contributions: (1) a generative canonicalization module that processes multiple unstructured views into a standardized, consistent representation, and (2) a transformer-based model trained on a new, large-scale dataset of high-fidelity Gaussian splatting avatars derived from dome captures of real people. This "Capture, Canonicalize, Splat" pipeline produces static quarter-body avatars with compelling realism and robust identity preservation from unstructured photos.
- Abstract(参考訳): 我々は、いくつかの非構造化電話画像から超現実的でアイデンティティを保存する3Dアバターを作成するための、新しいゼロショットパイプラインを提案する。
単一ビューアプローチは幾何学的不整合と幻覚に悩まされ、アイデンティティの保存が低下する一方、合成データで訓練されたモデルは、皮膚のしわや細い毛のような高周波の詳細を捉えず、リアリズムを制限している。
提案手法では,(1)複数の非構造化ビューを標準化された一貫した表現として処理する生成正準化モジュール,(2)実物のドームキャプチャーから派生した高忠実度ガウススプラッティングアバターの大規模データセットをトレーニングしたトランスフォーマーベースモデルを提案する。
この"Capture, Canonicalize, Splat"パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的な四角形アバターを生成する。
関連論文リスト
- MoGA: 3D Generative Avatar Prior for Monocular Gaussian Avatar Reconstruction [65.5412504339528]
MoGAは高忠実度3Dガウスアバターを単一視点画像から再構成する新しい手法である。
提案手法は最先端の手法を超越し,実世界のシナリオを一般化する。
論文 参考訳(メタデータ) (2025-07-31T14:36:24Z) - FRESA: Feedforward Reconstruction of Personalized Skinned Avatars from Few Images [74.86864398919467]
数枚の画像からリアルなアニメーションで、パーソナライズされた3Dアバターを再構成する新しい手法を提案する。
我々は、1000人以上の服を着た人間から普遍的な事前学習を行い、即時フィードフォワード生成とゼロショット一般化を実現する。
提案手法は, 最新技術よりも忠実な再構築とアニメーションを生成し, カジュアルに撮影された携帯電話写真からの入力に直接一般化することができる。
論文 参考訳(メタデータ) (2025-03-24T23:20:47Z) - Synthetic Prior for Few-Shot Drivable Head Avatar Inversion [61.51887011274453]
そこで本研究では,合成前駆体に基づく乾燥可能な頭部アバターの少数ショット逆転法であるSynShotを提案する。
合成データのみに基づいて訓練された機械学習モデルに着想を得て,合成頭部の大きなデータセットから先行モデルを学習する手法を提案する。
論文 参考訳(メタデータ) (2025-01-12T19:01:05Z) - Generalizable One-shot Neural Head Avatar [90.50492165284724]
本研究では,1枚の画像から3次元頭部アバターを再構成し,アニメイトする手法を提案する。
本研究では,一視点画像に基づく識別不能な人物を一般化するだけでなく,顔領域内外における特徴的詳細を捉えるフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-14T22:33:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。