論文の概要: FastAvatar: Towards Unified Fast High-Fidelity 3D Avatar Reconstruction with Large Gaussian Reconstruction Transformers
- arxiv url: http://arxiv.org/abs/2508.19754v1
- Date: Wed, 27 Aug 2025 10:30:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.593893
- Title: FastAvatar: Towards Unified Fast High-Fidelity 3D Avatar Reconstruction with Large Gaussian Reconstruction Transformers
- Title(参考訳): Fast Avatar: ガウス変換器を用いた高速3次元アバター再構成
- Authors: Yue Wu, Yufan Wu, Wen Li, Yuxi Lu, Kairui Feng, Xuanhong Chen,
- Abstract要約: FastAvatarはフィードフォワード3Dアバターフレームワークで、多様な日々の録音を柔軟に活用することができる。
高品質な3Dガウススプラッティング(3DGS)モデルを1つの統一モデルで数秒で再構築する。
- 参考スコア(独自算出の注目度): 19.37926572767567
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite significant progress in 3D avatar reconstruction, it still faces challenges such as high time complexity, sensitivity to data quality, and low data utilization. We propose FastAvatar, a feedforward 3D avatar framework capable of flexibly leveraging diverse daily recordings (e.g., a single image, multi-view observations, or monocular video) to reconstruct a high-quality 3D Gaussian Splatting (3DGS) model within seconds, using only a single unified model. FastAvatar's core is a Large Gaussian Reconstruction Transformer featuring three key designs: First, a variant VGGT-style transformer architecture aggregating multi-frame cues while injecting initial 3D prompt to predict an aggregatable canonical 3DGS representation; Second, multi-granular guidance encoding (camera pose, FLAME expression, head pose) mitigating animation-induced misalignment for variable-length inputs; Third, incremental Gaussian aggregation via landmark tracking and sliced fusion losses. Integrating these features, FastAvatar enables incremental reconstruction, i.e., improving quality with more observations, unlike prior work wasting input data. This yields a quality-speed-tunable paradigm for highly usable avatar modeling. Extensive experiments show that FastAvatar has higher quality and highly competitive speed compared to existing methods.
- Abstract(参考訳): 3Dアバター再構成の大幅な進歩にもかかわらず、高時間複雑化、データ品質への敏感さ、データ利用の低さといった課題に直面している。
我々は,高品質な3Dガウス・スティング(3DGS)モデルを,単一の統一モデルのみを用いて数秒で再構築するために,多様な日常記録(例えば,単一画像,多視点観察,モノクロビデオ)を柔軟に活用できるフィードフォワード3DアバターフレームワークであるFastAvatarを提案する。
FastAvatarのコアは3つの重要な設計を特徴とする大型ガウス変換器である: 第一に、可変長入力に対するアニメーションによる不整合を軽減し、第3に、ランドマーク追跡とスライスドフュージョンロスによるインクリメンタルガウスアグリゲーションを緩和する、初期3Dプロンプトを注入してアグリガブルな標準3DGS表現を予測する、変種VGGTスタイルのトランスフォーマーアーキテクチャである。
これらの機能を統合することで、FastAvatarはインクリメンタルな再構築を可能にする。
これにより、高度に使用可能なアバターモデリングのための品質-速度-可変パラダイムが得られる。
大規模な実験により、FastAvatarは既存の手法に比べて高品質で競争力が高いことが示されている。
関連論文リスト
- FastAvatar: Instant 3D Gaussian Splatting for Faces from Single Unconstrained Poses [23.466614265649373]
我々は、ポーズ不変フィードフォワードフレームワークであるFastAvatarについて、ほぼ瞬時に単一の顔画像から3次元ガウススプラッティング(3DGS)モデルを生成することができる。
FastAvatarは、既存のフィードフォワードの3DGS手法を再現品質で大幅に上回り、顔ごとの最適化手法よりも1000倍高速に動作します。
論文 参考訳(メタデータ) (2025-08-25T18:29:05Z) - HORT: Monocular Hand-held Objects Reconstruction with Transformers [61.36376511119355]
モノクロ画像から手持ちの物体を3Dで再構成することは、コンピュータビジョンにおいて重要な課題である。
ハンドヘルドオブジェクトの高密度な3次元点群を効率的に再構成するトランスフォーマーモデルを提案する。
提案手法は,高速な推測速度で最先端の精度を達成し,画像の幅を最適化する。
論文 参考訳(メタデータ) (2025-03-27T09:45:09Z) - Generalizable and Animatable Gaussian Head Avatar [50.34788590904843]
本稿では,GAGAvatar(Generalizable and Animatable Gaussian Head Avatar)を提案する。
我々は、1つの前方通過で1つの画像から3次元ガウスのパラメータを生成する。
提案手法は, 従来の手法と比較して, 再現性や表現精度の点で優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-10T14:29:00Z) - MVGamba: Unify 3D Content Generation as State Space Sequence Modeling [150.80564081817786]
本稿では,多視点ガウス再構成器を備えた一般軽量ガウス再構成モデルMVGambaを紹介する。
オフザディテールのマルチビュー拡散モデルを統合することで、MVGambaは単一の画像、スパース画像、テキストプロンプトから3D生成タスクを統一する。
実験により、MVGambaは、すべての3Dコンテンツ生成シナリオで最先端のベースラインを約0.1タイムのモデルサイズで上回ります。
論文 参考訳(メタデータ) (2024-06-10T15:26:48Z) - Triplane Meets Gaussian Splatting: Fast and Generalizable Single-View 3D
Reconstruction with Transformers [37.14235383028582]
本稿では,フィードフォワード推論を用いて,単一画像から3次元モデルを効率よく生成する,一視点再構成のための新しい手法を提案する。
提案手法では,2つのトランスフォーマーネットワーク,すなわちポイントデコーダとトリプレーンデコーダを用いて,ハイブリッドトリプレーン・ガウス中間表現を用いて3次元オブジェクトを再構成する。
論文 参考訳(メタデータ) (2023-12-14T17:18:34Z) - InvertAvatar: Incremental GAN Inversion for Generalized Head Avatars [40.10906393484584]
本稿では,複数フレームからの忠実度向上を目的としたアルゴリズムを用いて,アバター復元性能を向上させる新しいフレームワークを提案する。
本アーキテクチャでは,画素対応画像-画像変換を重要視し,観測空間と標準空間の対応を学習する必要性を緩和する。
提案手法は,1ショットと数ショットのアバターアニメーションタスクにおける最先端の性能を示す。
論文 参考訳(メタデータ) (2023-12-03T18:59:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。