論文の概要: Feed-forward Gaussian Registration for Head Avatar Creation and Editing
- arxiv url: http://arxiv.org/abs/2603.15811v1
- Date: Mon, 16 Mar 2026 18:42:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:06.947839
- Title: Feed-forward Gaussian Registration for Head Avatar Creation and Editing
- Title(参考訳): 頭部アバター作成と編集のためのフィードフォワードガウス登録
- Authors: Malte Prinzler, Paulo Gotardo, Siyu Tang, Timo Bolkart,
- Abstract要約: MATCHは、高品質なアバターの作成と編集のための多視点ガウス登録法である。
フレーム当たり0.5秒で多視点画像と対応してガウスのスプレートテクスチャを直接予測する。
アバター生成は、最も近い競合するベースラインの10倍高速である。
- 参考スコア(独自算出の注目度): 18.828792839070264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present MATCH (Multi-view Avatars from Topologically Corresponding Heads), a multi-view Gaussian registration method for high-quality head avatar creation and editing. State-of-the-art multi-view head avatar methods require time-consuming head tracking followed by expensive avatar optimization, often resulting in a total creation time of more than one day. MATCH, in contrast, directly predicts Gaussian splat textures in correspondence from calibrated multi-view images in just 0.5 seconds per frame, without requiring data preprocessing. The learned intra-subject correspondence across frames enables fast creation of personalized head avatars, while correspondence across subjects supports applications such as expression transfer, optimization-free tracking, semantic editing, and identity interpolation. We establish these correspondences end-to-end using a transformer-based model that predicts Gaussian splat textures in the fixed UV layout of a template mesh. To achieve this, we introduce a novel registration-guided attention block, where each UV-map token attends exclusively to image tokens depicting its corresponding mesh region. This design improves efficiency and performance compared to dense cross-view attention. MATCH outperforms existing methods in novel-view synthesis, geometry registration, and head avatar generation, while making avatar creation 10 times faster than the closest competing baseline. The code and model weights are available on the project website.
- Abstract(参考訳): MATCH(Multi-view Avatars from Topologically Cor correspondinging Heads)は,高品質な頭部アバター作成・編集のための多視点ガウス登録法である。
最先端のマルチビューヘッドアバター手法では、時間を要するヘッドトラッキングと高価なアバター最適化が必要であり、しばしば1日以上作成される。
対照的に、MATCHは、データ前処理を必要とせず、1フレームあたり0.5秒でキャリブレーションされたマルチビュー画像から、ガウススプレートテクスチャを直接予測する。
フレーム間の学習されたオブジェクト内対応により、パーソナライズされた頭部アバターの高速作成が可能となり、一方、被写体間の対応は、表現伝達、最適化不要な追跡、意味編集、アイデンティティ補間などのアプリケーションをサポートする。
テンプレートメッシュの固定UVレイアウトにおけるガウススプレートテクスチャを予測するトランスフォーマーモデルを用いて,これらの対応関係をエンドツーエンドに構築する。
これを実現するために,各UVマップトークンが対応するメッシュ領域を表す画像トークンにのみ参加する,新規な登録誘導型アテンションブロックを導入する。
この設計は、高密度のクロスビューアテンションに比べて効率と性能を向上させる。
MATCHは、新しいビュー合成、ジオメトリ登録、ヘッドアバター生成において既存の手法よりも優れており、アバター生成は最も近い競合するベースラインの10倍高速である。
コードとモデルの重み付けはプロジェクトのWebサイトにある。
関連論文リスト
- OMEGA-Avatar: One-shot Modeling of 360° Gaussian Avatars [54.688420347927725]
OMEGA-Avatarは、単一の画像から一般化可能で360度完全でアニマブルな3Dガウスヘッドを同時に生成する最初のフレームワークである。
OMEGA-Avatarは最先端の性能を達成し,360度フルヘッド完全性において既存のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-12T08:16:38Z) - FastGHA: Generalized Few-Shot 3D Gaussian Head Avatars with Real-Time Animation [26.161556787983496]
OURSは、少数の入力画像から高品質なガウスヘッドアバターを生成するフィードフォワード方式である。
提案手法は,入力画像から画素ごとのガウス表現を直接学習する。
実験の結果,提案手法は,レンダリング品質と推論効率の両方において,既存の手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2026-01-20T10:49:49Z) - UIKA: Fast Universal Head Avatar from Pose-Free Images [65.03770342532134]
フィードフォワードでアニマタブルなガウスヘッドモデルであるウイカを任意の数の未入力から提示する。
従来のアバター法とは異なり、モデル表現、ネットワーク設計、データ準備のレンズを通してタスクを再考する。
本手法は,モノクロ・マルチビュー・セッティングにおいて既存手法よりも優れていた。
論文 参考訳(メタデータ) (2026-01-12T14:53:56Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.598772767324036]
本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - GaussianStyle: Gaussian Head Avatar via StyleGAN [64.85782838199427]
本稿では,3DGSのボリューム強度とStyleGANの強力な暗黙表現を統合する新しいフレームワークを提案する。
提案手法は, 再現性, 新規なビュー合成, アニメーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-01T18:14:42Z) - InvertAvatar: Incremental GAN Inversion for Generalized Head Avatars [40.10906393484584]
本稿では,複数フレームからの忠実度向上を目的としたアルゴリズムを用いて,アバター復元性能を向上させる新しいフレームワークを提案する。
本アーキテクチャでは,画素対応画像-画像変換を重要視し,観測空間と標準空間の対応を学習する必要性を緩和する。
提案手法は,1ショットと数ショットのアバターアニメーションタスクにおける最先端の性能を示す。
論文 参考訳(メタデータ) (2023-12-03T18:59:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。