論文の概要: FiCA: Feed-forward instant Gaussian Codec Avatars from a Single Portrait Image
- arxiv url: http://arxiv.org/abs/2606.24232v1
- Date: Tue, 23 Jun 2026 07:22:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.819941
- Title: FiCA: Feed-forward instant Gaussian Codec Avatars from a Single Portrait Image
- Title(参考訳): FiCA: 単一ポートレート画像からのフィードフォワードインスタントガウスコーデックアバター
- Authors: Kim Youwang, Zhengyu Yang, Liuhao Ge, Yu Rong, Timur Bagautdinov, Su Zhaoen, Nir Sopher, Jovan Popović, Teng Deng, Tae-Hyun Oh, Chen Cao,
- Abstract要約: フィードフォワード,即時ガウスコーデックアバター生成パイプラインであるFiCAを導入し,単一のイメージからライフライクなアバターを生成する。
実験により, フィードフォワードアプローチによって生成されたアバターは, 多様なアイデンティティを忠実に表現し, 競合する最近の手法によるアバターの視覚的品質を上回っていることが示された。
- 参考スコア(独自算出の注目度): 26.57429602358677
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce FiCA, a Feed-forward, instant Gaussian Codec Avatar generation pipeline that creates lifelike avatars from a single portrait image. Generating a photorealistic and drivable avatar from just a single image is significantly challenging due to the limited visual information available to accurately infer the 3D appearance and geometry of human heads. To address this, we develop a novel system that combines human-centric vision foundation models with a diffusion model. This system is designed to fully exploit partial visual observations to generate lifelike human avatars. Our proposed diffusion model learns a generative mapping from these partial observations to complete and authentic 3D mesh reconstruction. Additionally, we introduce a feed-forward mesh refinement network that enhances the fidelity and identity preservation of the generated avatars, eliminating the need for person-specific test-time optimization. By leveraging a universal prior model that decodes a generated mesh into a set of 3D Gaussians, we generate a photorealistic 3D Gaussian avatar, capable of being driven with novel expressions in real-time. Our experiments demonstrate that the avatars generated by our feed-forward approach faithfully represent diverse identities and surpass the visual quality of avatars produced by recent competing methods.
- Abstract(参考訳): 本研究では、フィードフォワード、即時ガウスコーデックアバター生成パイプラインであるFiCAを紹介し、単一のポートレートイメージからライフライクなアバターを生成する。
人間の頭部の3D形状や形状を正確に推測するために利用可能な視覚情報が限られているため、単一の画像からフォトリアリスティックで乾燥可能なアバターを生成することは極めて困難である。
そこで我々は,人間中心の視覚基盤モデルと拡散モデルを組み合わせた新しいシステムを開発した。
このシステムは、部分的な視覚的観察をフル活用して、生命に似た人間のアバターを生成するように設計されている。
提案する拡散モデルでは,これらの部分的観測から生成的マッピングを学習し,完全な3Dメッシュ再構成を実現する。
さらに,生成されたアバターの忠実度とアイデンティティを向上し,個人固有のテストタイム最適化の必要性を解消するフィードフォワードメッシュリファインメントネットワークを導入する。
生成したメッシュを3次元ガウスアンの集合にデコードする普遍的事前モデルを活用することで,新しい表現をリアルタイムに駆動できるフォトリアリスティックな3次元ガウスアバターを生成する。
実験により, フィードフォワードアプローチによって生成されたアバターは, 多様なアイデンティティを忠実に表現し, 競合する最近の手法によるアバターの視覚的品質を上回っていることが示された。
関連論文リスト
- MoGA: 3D Generative Avatar Prior for Monocular Gaussian Avatar Reconstruction [65.5412504339528]
MoGAは高忠実度3Dガウスアバターを単一視点画像から再構成する新しい手法である。
提案手法は最先端の手法を超越し,実世界のシナリオを一般化する。
論文 参考訳(メタデータ) (2025-07-31T14:36:24Z) - Multimodal Generation of Animatable 3D Human Models with AvatarForge [67.31920821192323]
AvatarForgeはAI駆動の手続き生成を使用してテキストや画像入力からアニマタブルな3Dアバターを生成するフレームワークである。
評価の結果、AvatarForgeはテキストと画像とアバターの生成において最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-03-11T08:29:18Z) - Generalizable and Animatable Gaussian Head Avatar [50.34788590904843]
本稿では,GAGAvatar(Generalizable and Animatable Gaussian Head Avatar)を提案する。
我々は、1つの前方通過で1つの画像から3次元ガウスのパラメータを生成する。
提案手法は, 従来の手法と比較して, 再現性や表現精度の点で優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-10T14:29:00Z) - GenCA: A Text-conditioned Generative Model for Realistic and Drivable Codec Avatars [44.8290935585746]
フォトリアリスティックでコントロール可能な3Dアバターは、バーチャルリアリティー(VR/MR)、テレプレゼンス、ゲーム、映画制作など、様々な用途に欠かせない。
アバター作成の伝統的な方法は、しばしば各アバターのスキャンと再構築に時間を要する。
本稿では,多彩なアイデンティティを持つ写真リアルな顔アバターを生成可能なテキスト条件生成モデルを提案する。
論文 参考訳(メタデータ) (2024-08-24T21:25:22Z) - AvatarBooth: High-Quality and Customizable 3D Human Avatar Generation [14.062402203105712]
AvatarBoothはテキストプロンプトや特定の画像を使って高品質な3Dアバターを生成する新しい方法である。
我々の重要な貢献は、二重微調整拡散モデルを用いた正確なアバター生成制御である。
本稿では,3次元アバター生成の粗大な監視を容易にするマルチレゾリューションレンダリング戦略を提案する。
論文 参考訳(メタデータ) (2023-06-16T14:18:51Z) - DreamAvatar: Text-and-Shape Guided 3D Human Avatar Generation via
Diffusion Models [55.71306021041785]
高品質な3Dアバターを作成するためのテキスト・アンド・シェイプ・ガイドフレームワークであるDreamAvatarについて紹介する。
SMPLモデルを利用して、生成のための形状とポーズのガイダンスを提供する。
また、全体とズームインした3Dヘッドから計算した損失を共同で最適化し、一般的なマルチフェイス「Janus」問題を緩和する。
論文 参考訳(メタデータ) (2023-04-03T12:11:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。