論文の概要: Any3DAvatar: Fast and High-Quality Full-Head 3D Avatar Reconstruction from Single Portrait Image
- arxiv url: http://arxiv.org/abs/2604.13856v1
- Date: Wed, 15 Apr 2026 13:24:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.555319
- Title: Any3DAvatar: Fast and High-Quality Full-Head 3D Avatar Reconstruction from Single Portrait Image
- Title(参考訳): Any3DAvatar:単一ポートレート画像からの高速かつ高品質フルヘッド3Dアバター再構成
- Authors: Yujie Gao, Yao Xiao, Xiangnan Zhu, Ya Li, Yiyi Zhang, Liqing Zhang, Jianfu Zhang,
- Abstract要約: 単一画像のガウス頭部アバター生成のための高速かつ高品質なAny3DAvatarを提案する。
本研究では,Any3DAvatarのレンダリング精度は従来よりも向上し,精度は大幅に向上した。
- 参考スコア(独自算出の注目度): 25.004940287308035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reconstructing a complete 3D head from a single portrait remains challenging because existing methods still face a sharp quality-speed trade-off: high-fidelity pipelines often rely on multi-stage processing and per-subject optimization, while fast feed-forward models struggle with complete geometry and fine appearance details. To bridge this gap, we propose Any3DAvatar, a fast and high-quality method for single-image 3D Gaussian head avatar generation, whose fastest setting reconstructs a full head in under one second while preserving high-fidelity geometry and texture. First, we build AnyHead, a unified data suite that combines identity diversity, dense multi-view supervision, and realistic accessories, filling the main gaps of existing head data in coverage, full-head geometry, and complex appearance. Second, rather than sampling unstructured noise, we initialize from a Plücker-aware structured 3D Gaussian scaffold and perform one-step conditional denoising, formulating full-head reconstruction into a single forward pass while retaining high fidelity. Third, we introduce auxiliary view-conditioned appearance supervision on the same latent tokens alongside 3D Gaussian reconstruction, improving novel-view texture details at zero extra inference cost. Experiments show that Any3DAvatar outperforms prior single-image full-head reconstruction methods in rendering fidelity while remaining substantially faster.
- Abstract(参考訳): 高忠実度パイプラインは、しばしばマルチステージ処理とオブジェクトごとの最適化に依存し、高速フィードフォワードモデルは完全な幾何学と細かい外観の詳細に苦しむ。
このギャップを埋めるために,高速かつ高品質な3次元ガウスヘッドアバター生成法であるAny3DAvatarを提案する。
まず、アイデンティティの多様性、密集したマルチビューの監視、現実的なアクセサリーを組み合わせた統合データスイートであるAnyHeadを構築します。
第2に、非構造ノイズをサンプリングする代わりに、プルッカー対応構造を有する3次元ガウス足場から初期化し、1ステップの条件記述を行い、高い忠実性を維持しながら、全頭部再構成を1つの前方通過に定式化する。
第3に、3次元ガウシアン再構成と並行して、同一の潜伏トークンに補助視条件付き外観監視を導入し、新規視テクスチャの詳細を余分な推論コストゼロで改善する。
実験により、Any3DAvatarは、より高速ながら忠実なレンダリングにおいて、以前の単一画像のフルヘッド再構成方法よりも優れていることが示された。
関連論文リスト
- HairOrbit: Multi-view Aware 3D Hair Modeling from Single Portraits [11.543903055509402]
単一視点の髪型再構成を校正した多面的再構成タスクに変換するための新しい枠組みを提案する。
我々は、より優れたフルビュー指向推定のためのスパース実像アノテーションに基づいて訓練されたニューラルオリエンテーション抽出器を導入する。
本手法は, 視認域と視認域の多彩なヘアポートレートを用いて, ワンビュー3次元ヘアストランド再構築における最先端性能を実現する。
論文 参考訳(メタデータ) (2026-04-03T08:35:35Z) - FHAvatar: Fast and High-Fidelity Reconstruction of Face-and-Hair Composable 3D Head Avatar from Few Casual Captures [13.76145751985277]
任意の視点から顔と髪の成分を合成可能な3次元ガウスアバターを再構成するための新しいフレームワークであるFHAvatarについて述べる。
実験により、FHAvatarは数分で新しいアイデンティティを数回だけ観察することで、最先端の再構築品質を達成することが示された。
論文 参考訳(メタデータ) (2026-03-24T15:43:54Z) - OMEGA-Avatar: One-shot Modeling of 360° Gaussian Avatars [54.688420347927725]
OMEGA-Avatarは、単一の画像から一般化可能で360度完全でアニマブルな3Dガウスヘッドを同時に生成する最初のフレームワークである。
OMEGA-Avatarは最先端の性能を達成し,360度フルヘッド完全性において既存のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-12T08:16:38Z) - Wonder3D++: Cross-domain Diffusion for High-fidelity 3D Generation from a Single Image [68.55613894952177]
単一ビュー画像から高忠実なテクスチャメッシュを効率的に生成する新しい手法である textbfWonder3D++ を導入する。
マルチビュー正規写像と対応するカラー画像を生成するクロスドメイン拡散モデルを提案する。
最後に,多視点2次元表現から高品質な表面を粗い方法でわずか3ドル程度で駆動するカスケード3次元メッシュ抽出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:24:18Z) - PanoLAM: Large Avatar Model for Gaussian Full-Head Synthesis from One-shot Unposed Image [43.212662742135954]
本稿では,ガウス全頭部合成のためのフィードフォワード・フレームワークを提案する。
従来のGANインバージョンとテスト時間最適化に依存した作業とは異なり、我々のフレームワークは、1つの未提示画像が1つの前方パスで与えられると、ガウスのフルヘッドモデルを再構築することができる。
論文 参考訳(メタデータ) (2025-09-09T09:42:31Z) - FaceLift: Learning Generalizable Single Image 3D Face Reconstruction from Synthetic Heads [54.24070918942727]
1枚の画像から高画質の360度3Dヘッドを復元するための新しいフィードフォワードアプローチであるFaceLiftを提案する。
パイプラインはまずマルチビューの潜伏拡散モデルを用いて、1つの入力から一貫したサイドビューとバックビューを生成する。
FaceLiftは、アイデンティティ保存、ディテールリカバリ、レンダリング品質において、最先端の3D顔再構成方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-12-23T18:59:49Z) - Implicit Shape and Appearance Priors for Few-Shot Full Head Reconstruction [16.082960967820036]
本稿では,数発のフル3次元頭部再構成の問題点に対処する。
我々は、座標に基づく表現に先立って確率的形状と外観を組み込むことにより、これを達成した。
我々はH3DSデータセットを拡張し、60個の高解像度3Dフルヘッドスキャンと対応する画像とマスクを含む。
論文 参考訳(メタデータ) (2023-10-12T07:35:30Z) - Generalizable One-shot Neural Head Avatar [90.50492165284724]
本研究では,1枚の画像から3次元頭部アバターを再構成し,アニメイトする手法を提案する。
本研究では,一視点画像に基づく識別不能な人物を一般化するだけでなく,顔領域内外における特徴的詳細を捉えるフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-14T22:33:09Z) - High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。
提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。