論文の概要: CAG-Avatar: Cross-Attention Guided Gaussian Avatars for High-Fidelity Head Reconstruction
- arxiv url: http://arxiv.org/abs/2601.14844v1
- Date: Wed, 21 Jan 2026 10:22:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.327609
- Title: CAG-Avatar: Cross-Attention Guided Gaussian Avatars for High-Fidelity Head Reconstruction
- Title(参考訳): CAG-Avatar:高忠実度頭部再建のための交差注意誘導型ガウスアバター
- Authors: Zhe Chang, Haodong Jin, Yan Song, Hui Yu,
- Abstract要約: アニメーション技術は、しばしば"ワンサイズフィット"なグローバルチューニングアプローチに依存している。
クロスアテンション上に構築された条件適応型核融合モジュールについて紹介する。
実験では、特に歯などの挑戦的な領域において、再建の忠実度が著しく向上していることが確認されている。
- 参考スコア(独自算出の注目度): 7.698661374784336
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating high-fidelity, real-time drivable 3D head avatars is a core challenge in digital animation. While 3D Gaussian Splashing (3D-GS) offers unprecedented rendering speed and quality, current animation techniques often rely on a "one-size-fits-all" global tuning approach, where all Gaussian primitives are uniformly driven by a single expression code. This simplistic approach fails to unravel the distinct dynamics of different facial regions, such as deformable skin versus rigid teeth, leading to significant blurring and distortion artifacts. We introduce Conditionally-Adaptive Gaussian Avatars (CAG-Avatar), a framework that resolves this key limitation. At its core is a Conditionally Adaptive Fusion Module built on cross-attention. This mechanism empowers each 3D Gaussian to act as a query, adaptively extracting relevant driving signals from the global expression code based on its canonical position. This "tailor-made" conditioning strategy drastically enhances the modeling of fine-grained, localized dynamics. Our experiments confirm a significant improvement in reconstruction fidelity, particularly for challenging regions such as teeth, while preserving real-time rendering performance.
- Abstract(参考訳): 高忠実でリアルタイムに乾燥可能な3Dヘッドアバターを作ることは、デジタルアニメーションにおける中核的な課題である。
3D Gaussian Splashing (3D-GS)は前代未聞のレンダリング速度と品質を提供するが、現在のアニメーション技術は、すべてのガウスプリミティブが1つの式コードによって一様に駆動される"ワンサイズフィット"なグローバルチューニングアプローチに依存していることが多い。
この単純なアプローチは、変形可能な皮膚と硬い歯など、異なる顔領域の異なるダイナミクスを解き明かすことに失敗し、著しいぼやけや歪曲を生じさせる。
本稿では,この制約を解消するフレームワークであるCAG-Avatarsを紹介する。
コアとなるのは、クロスアテンション上に構築された条件適応型核融合モジュールである。
このメカニズムにより、各3Dガウスがクエリとして機能し、その標準位置に基づいて、グローバル表現コードから関連する駆動信号を適応的に抽出する。
この「テーラーメイド」条件付け戦略は、微細で局所的な力学のモデリングを大幅に強化する。
本実験は, リアルタイムレンダリング性能を保ちながら, 特に歯などの難治領域において, 再現率の大幅な向上を確認した。
関連論文リスト
- FastGHA: Generalized Few-Shot 3D Gaussian Head Avatars with Real-Time Animation [26.161556787983496]
OURSは、少数の入力画像から高品質なガウスヘッドアバターを生成するフィードフォワード方式である。
提案手法は,入力画像から画素ごとのガウス表現を直接学習する。
実験の結果,提案手法は,レンダリング品質と推論効率の両方において,既存の手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2026-01-20T10:49:49Z) - CaricatureGS: Exaggerating 3D Gaussian Splatting Faces With Gaussian Curvature [13.47263744740423]
顔のための制御可能で制御可能な3Dキャラクタライゼーションフレームワークを紹介する。
我々は3Dガウススティング(3DGS)を利用しており、これは近年、現実的な自由視点アバターを生み出すことが示されている。
論文 参考訳(メタデータ) (2026-01-06T13:56:28Z) - TexAvatars : Hybrid Texel-3D Representations for Stable Rigging of Photorealistic Gaussian Head Avatars [47.957612931386926]
テクスアバター(TexAvatars)は、解析リグの明示的な幾何学的基底とテクセル空間の空間的連続性を組み合わせたハイブリッド表現である。
提案手法は,CNNを用いてUV空間の局所的幾何学特性を推定するが,メッシュ認識ヤコビアンによる3次元変形を駆動する。
提案手法は,過度なポーズと表現変化下での最先端性能を実現し,挑戦的な頭部再現設定において強力な一般化を示す。
論文 参考訳(メタデータ) (2025-12-24T10:50:04Z) - AGORA: Adversarial Generation Of Real-time Animatable 3D Gaussian Head Avatars [54.854597811704316]
AGORAは、3DGSを生成的敵ネットワーク内で拡張し、アニマタブルなアバターを生成する新しいフレームワークである。
表現の忠実度は、二重識別器の訓練スキームによって強制される。
AGORAは視覚的にリアルなだけでなく、正確に制御可能なアバターを生成する。
論文 参考訳(メタデータ) (2025-12-06T14:05:20Z) - TeGA: Texture Space Gaussian Avatars for High-Resolution Dynamic Head Modeling [52.87836237427514]
フォトリアルアバターは、テレプレゼンス、拡張現実、エンターテイメントにおける新興アプリケーションにおいて重要な要素であると見なされている。
本稿では,最先端の3Dヘッドアバターモデルを提案する。
論文 参考訳(メタデータ) (2025-05-08T22:10:27Z) - Generalizable and Animatable Gaussian Head Avatar [50.34788590904843]
本稿では,GAGAvatar(Generalizable and Animatable Gaussian Head Avatar)を提案する。
我々は、1つの前方通過で1つの画像から3次元ガウスのパラメータを生成する。
提案手法は, 従来の手法と比較して, 再現性や表現精度の点で優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-10T14:29:00Z) - GaussianStyle: Gaussian Head Avatar via StyleGAN [64.85782838199427]
本稿では,3DGSのボリューム強度とStyleGANの強力な暗黙表現を統合する新しいフレームワークを提案する。
提案手法は, 再現性, 新規なビュー合成, アニメーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-01T18:14:42Z) - GaussianHead: High-fidelity Head Avatars with Learnable Gaussian Derivation [35.39887092268696]
本稿では, 異方性3次元ガウスモデルを用いて, 動作する人間の頭部をモデル化する枠組みを提案する。
実験では,高忠実度レンダリング,再現における最先端のアプローチ,クロスアイデンティティの再現,新しいビュー合成タスクを実現できる。
論文 参考訳(メタデータ) (2023-12-04T05:24:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。