論文の概要: ELITE: Efficient Gaussian Head Avatar from a Monocular Video via Learned Initialization and TEst-time Generative Adaptation
- arxiv url: http://arxiv.org/abs/2601.10200v1
- Date: Thu, 15 Jan 2026 08:57:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:19.06948
- Title: ELITE: Efficient Gaussian Head Avatar from a Monocular Video via Learned Initialization and TEst-time Generative Adaptation
- Title(参考訳): ELITE:学習初期化と遠隔生成適応による単眼映像からの効率的なガウス頭部アバター
- Authors: Kim Youwang, Lee Hyoseok, Subin Park, Gerard Pons-Moll, Tae-Hyun Oh,
- Abstract要約: ELITEは2次元生成前の方法よりも60倍高速に達成しながら、従来の手法よりも視覚的に優れたアバターを生産する。
実験の結果, 従来の2次元生成法よりも60倍高速で, 従来の手法よりも視覚的に優れたアバターが得られた。
- 参考スコア(独自算出の注目度): 47.325600830154116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce ELITE, an Efficient Gaussian head avatar synthesis from a monocular video via Learned Initialization and TEst-time generative adaptation. Prior works rely either on a 3D data prior or a 2D generative prior to compensate for missing visual cues in monocular videos. However, 3D data prior methods often struggle to generalize in-the-wild, while 2D generative prior methods are computationally heavy and prone to identity hallucination. We identify a complementary synergy between these two priors and design an efficient system that achieves high-fidelity animatable avatar synthesis with strong in-the-wild generalization. Specifically, we introduce a feed-forward Mesh2Gaussian Prior Model (MGPM) that enables fast initialization of a Gaussian avatar. To further bridge the domain gap at test time, we design a test-time generative adaptation stage, leveraging both real and synthetic images as supervision. Unlike previous full diffusion denoising strategies that are slow and hallucination-prone, we propose a rendering-guided single-step diffusion enhancer that restores missing visual details, grounded on Gaussian avatar renderings. Our experiments demonstrate that ELITE produces visually superior avatars to prior works, even for challenging expressions, while achieving 60x faster synthesis than the 2D generative prior method.
- Abstract(参考訳): 本稿では,学習初期化とTEst-time生成適応による単眼ビデオからの効率的なガウス頭部アバター合成法であるELITEを紹介する。
以前の作品は、モノクロビデオに欠けている視覚的手がかりを補うために、3Dデータの先行と2D生成のいずれかに依存していた。
しかし、3Dデータ先行手法は、しばしば夢中を一般化するのに苦労するが、2D生成前の手法は計算的に重く、アイデンティティ幻覚の傾向にある。
これら2つの先行概念間の相補的な相乗効果を同定し,高忠実でアニマタブルなアバター合成を実現する効率的なシステムの設計を行う。
具体的には、ガウスアバターの高速初期化を可能にするフィードフォワードのMesh2Gaussian Prior Model (MGPM)を導入する。
テスト時の領域ギャップをさらに埋めるために、実画像と合成画像の両方を監督として活用して、テスト時間生成適応ステージを設計する。
従来のフル拡散復調手法と異なり,ガウスアバターレンダリングを基礎として,視覚的詳細の欠如を復元するレンダリング誘導単段拡散増進器を提案する。
実験の結果, 従来の2次元生成法よりも60倍高速な合成が可能でありながら, 従来の手法よりも視覚的に優れたアバターが得られた。
関連論文リスト
- AGORA: Adversarial Generation Of Real-time Animatable 3D Gaussian Head Avatars [54.854597811704316]
AGORAは、3DGSを生成的敵ネットワーク内で拡張し、アニマタブルなアバターを生成する新しいフレームワークである。
表現の忠実度は、二重識別器の訓練スキームによって強制される。
AGORAは視覚的にリアルなだけでなく、正確に制御可能なアバターを生成する。
論文 参考訳(メタデータ) (2025-12-06T14:05:20Z) - Parametric Gaussian Human Model: Generalizable Prior for Efficient and Realistic Human Avatar Modeling [32.480049588166544]
フォトとアニマタブルな人間のアバターは、バーチャル/拡張現実、テレプレゼンス、デジタルエンターテイメントの鍵となる。
本稿では,人間を3DGSに統合する汎用的で効率的なフレームワークであるParametric Gaussian Human Model(PGHM)を提案する。
実験の結果、PGHMは最適化からスクラッチまでの手法よりもはるかに効率が良く、1被写体あたり約20分で同等の視覚的品質のアバターを生産できることがわかった。
論文 参考訳(メタデータ) (2025-06-07T03:53:30Z) - Synthetic Prior for Few-Shot Drivable Head Avatar Inversion [61.51887011274453]
そこで本研究では,合成前駆体に基づく乾燥可能な頭部アバターの少数ショット逆転法であるSynShotを提案する。
合成データのみに基づいて訓練された機械学習モデルに着想を得て,合成頭部の大きなデータセットから先行モデルを学習する手法を提案する。
論文 参考訳(メタデータ) (2025-01-12T19:01:05Z) - Generalizable and Animatable Gaussian Head Avatar [50.34788590904843]
本稿では,GAGAvatar(Generalizable and Animatable Gaussian Head Avatar)を提案する。
我々は、1つの前方通過で1つの画像から3次元ガウスのパラメータを生成する。
提案手法は, 従来の手法と比較して, 再現性や表現精度の点で優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-10T14:29:00Z) - Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities [10.816370283498287]
本稿では,まず頭部アバターの一般化モデルを取得し,その結果をパーソナライズする「ガウスデジャヴ」(Gaussian Deja-vu)フレームワークを紹介する。
パーソナライズのために、ニューラルネットワークに頼らずに迅速に収束する学習可能な表現認識補正ブレンドマップを提案する。
最先端の3Dガウシアンヘッドアバターをフォトリアリスティックな品質で上回り、既存の方法の少なくとも4分の1のトレーニング時間を短縮する。
論文 参考訳(メタデータ) (2024-09-23T00:11:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。