論文の概要: FastAvatar: Instant 3D Gaussian Splatting for Faces from Single Unconstrained Poses
- arxiv url: http://arxiv.org/abs/2508.18389v1
- Date: Mon, 25 Aug 2025 18:29:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.54969
- Title: FastAvatar: Instant 3D Gaussian Splatting for Faces from Single Unconstrained Poses
- Title(参考訳): FastAvatar:インスタント3Dガウシアン・スプレイティング
- Authors: Hao Liang, Zhixuan Ge, Ashish Tiwari, Soumendu Majee, G. M. Dilshan Godaliyadda, Ashok Veeraraghavan, Guha Balakrishnan,
- Abstract要約: 我々は、ポーズ不変フィードフォワードフレームワークであるFastAvatarについて、ほぼ瞬時に単一の顔画像から3次元ガウススプラッティング(3DGS)モデルを生成することができる。
FastAvatarは、既存のフィードフォワードの3DGS手法を再現品質で大幅に上回り、顔ごとの最適化手法よりも1000倍高速に動作します。
- 参考スコア(独自算出の注目度): 23.466614265649373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present FastAvatar, a pose-invariant, feed-forward framework that can generate a 3D Gaussian Splatting (3DGS) model from a single face image from an arbitrary pose in near-instant time (<10ms). FastAvatar uses a novel encoder-decoder neural network design to achieve both fast fitting and identity preservation regardless of input pose. First, FastAvatar constructs a 3DGS face ``template'' model from a training dataset of faces with multi-view captures. Second, FastAvatar encodes the input face image into an identity-specific and pose-invariant latent embedding, and decodes this embedding to predict residuals to the structural and appearance parameters of each Gaussian in the template 3DGS model. By only inferring residuals in a feed-forward fashion, model inference is fast and robust. FastAvatar significantly outperforms existing feed-forward face 3DGS methods (e.g., GAGAvatar) in reconstruction quality, and runs 1000x faster than per-face optimization methods (e.g., FlashAvatar, GaussianAvatars and GASP). In addition, FastAvatar's novel latent space design supports real-time identity interpolation and attribute editing which is not possible with any existing feed-forward 3DGS face generation framework. FastAvatar's combination of excellent reconstruction quality and speed expands the scope of 3DGS for photorealistic avatar applications in consumer and interactive systems.
- Abstract(参考訳): Invariant, feed-forward framework, which can generated a 3D Gaussian Splatting (3DGS) model from a single face image from a arbitrary pose in any-instant time (10ms)。
FastAvatarは、入力ポーズに関係なく、高速なフィッティングとアイデンティティ保存を実現するために、新しいエンコーダデコーダニューラルネットワーク設計を使用している。
まずFastAvatarは、3DGSの顔 ``template'' モデルを、マルチビューキャプチャによる顔のトレーニングデータセットから構築する。
第二に、FastAvatarは入力された顔画像をアイデンティティ固有かつポーズ不変の潜在埋め込みにエンコードし、この埋め込みをデコードし、テンプレート3DGSモデルにおける各ガウスの構造および外観パラメータの残差を予測する。
フィードフォワード方式で残差を推測するだけで、モデル推論は高速で堅牢である。
FastAvatarは、既存のフィードフォワードの3DGSメソッド(例:GAGAvatar)を再構築品質で大幅に上回り、顔ごとの最適化メソッド(例:FlashAvatar、GaussianAvatars、GASP)よりも1000倍速く動作します。
さらに、FastAvatarの新しい潜在空間設計は、既存のフィードフォワード3DGSの顔生成フレームワークでは不可能なリアルタイムID補間と属性編集をサポートする。
ファストアバターの優れた再構築品質とスピードの組み合わせは、コンシューマーおよびインタラクティブシステムにおけるフォトリアリスティックアバター応用のための3DGSの範囲を拡大する。
関連論文リスト
- Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance [69.9745497000557]
本稿では,人間の顔の基盤モデルを用いた最初のSDSベースの手法であるArc2Avatarについて述べる。
我々のアバターは人間の顔メッシュテンプレートとの密接な対応を維持しており、ブレンドシェープによる表現生成を可能にしている。
論文 参考訳(メタデータ) (2025-01-09T17:04:33Z) - Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities [10.816370283498287]
本稿では,まず頭部アバターの一般化モデルを取得し,その結果をパーソナライズする「ガウスデジャヴ」(Gaussian Deja-vu)フレームワークを紹介する。
パーソナライズのために、ニューラルネットワークに頼らずに迅速に収束する学習可能な表現認識補正ブレンドマップを提案する。
最先端の3Dガウシアンヘッドアバターをフォトリアリスティックな品質で上回り、既存の方法の少なくとも4分の1のトレーニング時間を短縮する。
論文 参考訳(メタデータ) (2024-09-23T00:11:30Z) - InstantSplat: Sparse-view Gaussian Splatting in Seconds [91.77050739918037]
InstantSplatは,光速でスパークビュー3Dシーンを再現する新しい手法である。
InstantSplatでは,3Dシーン表現とカメラポーズを最適化する,自己管理フレームワークを採用している。
3D-GSの従来のSfMと比較して、30倍以上の再現を達成し、視覚的品質(SSIM)を0.3755から0.7624に改善する。
論文 参考訳(メタデータ) (2024-03-29T17:29:58Z) - InvertAvatar: Incremental GAN Inversion for Generalized Head Avatars [40.10906393484584]
本稿では,複数フレームからの忠実度向上を目的としたアルゴリズムを用いて,アバター復元性能を向上させる新しいフレームワークを提案する。
本アーキテクチャでは,画素対応画像-画像変換を重要視し,観測空間と標準空間の対応を学習する必要性を緩和する。
提案手法は,1ショットと数ショットのアバターアニメーションタスクにおける最先端の性能を示す。
論文 参考訳(メタデータ) (2023-12-03T18:59:15Z) - Generalizable One-shot Neural Head Avatar [90.50492165284724]
本研究では,1枚の画像から3次元頭部アバターを再構成し,アニメイトする手法を提案する。
本研究では,一視点画像に基づく識別不能な人物を一般化するだけでなく,顔領域内外における特徴的詳細を捉えるフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-14T22:33:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。