論文の概要: Self-Learning Expression Deformations for Data-Efficient Gaussian Avatars
- arxiv url: http://arxiv.org/abs/2606.05912v1
- Date: Thu, 04 Jun 2026 09:18:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.681894
- Title: Self-Learning Expression Deformations for Data-Efficient Gaussian Avatars
- Title(参考訳): データ効率の良いガウスアバターの自己学習表現変形
- Authors: Jiahao Yang, Xiaohang Yang, Qing Wang, Yilan Dong, Gregory Slabaugh, Shanxin Yuan,
- Abstract要約: 自己適応型ガウス表現(Self-Adaptive Gaussian Expression, SAGE)は, 自己学習型ガウス変形のフレームワークである。
提案手法は,データ要求を桁違いに削減しつつ,最先端の手法に匹敵する再現性とアニメーション品質を実現する。
- 参考スコア(独自算出の注目度): 13.191351844883107
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modeling dynamic facial expressions using 3D Gaussian representations remains challenging due to their unstructured nature. Conventional Gaussian avatar pipelines require extensive multiview and sequential expression data, limiting scalability and accessibility. In this work, we introduce Self-Adaptive Gaussian Expression (SAGE), a framework for self-learning expression-induced Gaussian deformations that enables high-fidelity, animatable avatars from minimal input data. Our method jointly optimizes 2D Gaussian surfels and a Signed Distance Field (SDF) to enforce compact, surface-aligned Gaussian distributions, while a self-supervised expression learning phase replaces long training sequences with geometric and appearance consistency constraints. This design allows flexible deployment across multiple reconstruction regimes: in the multiview setting, only a single frame (timestep) is required instead of thousands; in the monocular setting, only head rotations are needed without expression sequences; and in the one-shot setting, no pretraining or priors are necessary. Experiments demonstrate that our approach achieves reconstruction and animation quality comparable to state-of-the-art methods, while reducing data requirements by several orders of magnitude. Our results highlight the potential of self-supervised Gaussian deformation learning as a step toward accessible, data-efficient avatar creation.
- Abstract(参考訳): 3次元ガウス表現を用いた動的表情のモデル化は、その非構造的性質のため、依然として困難である。
従来のガウスアバターパイプラインは、拡張性とアクセシビリティを制限するため、広範なマルチビューとシーケンシャルな表現データを必要とする。
本研究では,自己学習表現によるガウス変形のフレームワークである自己適応ガウス表現(SAGE)を導入し,最小入力データから高忠実でアニマタブルなアバターを実現する。
提案手法は2次元ガウス波動と符号付き距離場(Signed Distance Field, SDF)を併用して, コンパクトかつ面整合なガウス波動分布を強制し, 自己教師付き表現学習フェーズは, 長いトレーニングシーケンスを幾何学的および外観的整合性制約に置き換える。
マルチビュー設定では、数千ではなく1フレーム(タイムステップ)しか必要とせず、モノクラー設定では、ヘッドローテーションのみが式シーケンスなしで必要であり、ワンショット設定では事前訓練や事前訓練は不要である。
実験により,本手法は最先端の手法に匹敵する再現性とアニメーション品質を達成し,データ要求を桁違いに低減することを示した。
本結果は,データ効率のよいアバター作成に向けたステップとして,自己教師付きガウス変形学習の可能性を強調した。
関連論文リスト
- CaricatureGS: Exaggerating 3D Gaussian Splatting Faces With Gaussian Curvature [13.47263744740423]
顔のための制御可能で制御可能な3Dキャラクタライゼーションフレームワークを紹介する。
我々は3Dガウススティング(3DGS)を利用しており、これは近年、現実的な自由視点アバターを生み出すことが示されている。
論文 参考訳(メタデータ) (2026-01-06T13:56:28Z) - SPFSplatV2: Efficient Self-Supervised Pose-Free 3D Gaussian Splatting from Sparse Views [18.814209805277503]
スパース多視点画像から3次元ガウススプラッティングを行うための効率的なフィードフォワードフレームワークであるSPFSplatV2について述べる。
ドメイン内およびドメイン外の新規ビュー合成において、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-09-21T21:37:56Z) - FMGS-Avatar: Mesh-Guided 2D Gaussian Splatting with Foundation Model Priors for 3D Monocular Avatar Reconstruction [18.570290675633732]
2Dプリミティブをテンプレートメッシュ面に直接アタッチして位置、回転、動きを制限したメッシュガイド2Dガウススプラッティングを導入する。
Sapiensのような大規模データセットでトレーニングされた基礎モデルを活用して、モノクロビデオからの限られた視覚的手がかりを補完します。
実験により, 従来の手法に比べて再現性は優れており, 幾何的精度と外観忠実度は顕著に向上した。
論文 参考訳(メタデータ) (2025-09-18T08:41:41Z) - HoliGS: Holistic Gaussian Splatting for Embodied View Synthesis [59.25751939710903]
本稿では,長い単眼RGBビデオのエンボディドビュー合成に対処する,変形可能なガウススプラッティングフレームワークを提案する。
提案手法は,非可逆ガウス散乱変形ネットワークを利用して大規模動的環境を正確に再構築する。
その結果、現実のシナリオにおけるEVSの実用的でスケーラブルなソリューションが浮かび上がっています。
論文 参考訳(メタデータ) (2025-06-24T03:54:40Z) - EigenGS Representation: From Eigenspace to Gaussian Image Space [20.454762899389358]
EigenGSは、固有空間と画像空間のガウス表現を接続する効率的な変換パイプラインである。
EigenGSは直接2次元ガウスフィッティングよりも優れた再現性が得られることを示す。
結果は,様々な解像度と多様なカテゴリを持つ画像に対して,EigenGSの有効性と一般化能力を強調した。
論文 参考訳(メタデータ) (2025-03-10T15:27:03Z) - MonoGSDF: Exploring Monocular Geometric Cues for Gaussian Splatting-Guided Implicit Surface Reconstruction [86.87464903285208]
高品質な再構成のための神経信号距離場(SDF)とプリミティブを結合する新しい手法であるMonoGSDFを紹介する。
任意のスケールのシーンを扱うために,ロバストな一般化のためのスケーリング戦略を提案する。
実世界のデータセットの実験は、効率を保ちながら、以前の方法よりも優れています。
論文 参考訳(メタデータ) (2024-11-25T20:07:07Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.598772767324036]
本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - $E^{3}$Gen: Efficient, Expressive and Editable Avatars Generation [71.72171053129655]
本稿では,効率的な,表現的で編集可能なデジタルアバター生成のための3Dガウスモデルを提案する。
本稿では,これらの課題を効果的に解決するために,$E3$Genという新しいアバター生成手法を提案する。
提案手法は,アバター生成における優れた性能を実現し,表現力のあるフルボディポーズ制御と編集を可能にする。
論文 参考訳(メタデータ) (2024-05-29T15:43:49Z) - Mesh-based Gaussian Splatting for Real-time Large-scale Deformation [58.18290393082119]
ユーザがリアルタイムで大きな変形で暗黙の表現を直接変形または操作することは困難である。
我々は,インタラクティブな変形を可能にする新しいGSベースの手法を開発した。
提案手法は,高いフレームレートで良好なレンダリング結果を維持しつつ,高品質な再構成と効率的な変形を実現する。
論文 参考訳(メタデータ) (2024-02-07T12:36:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。