論文の概要: High-Fidelity Mobile Avatars with Pruned Local Blendshapes
- arxiv url: http://arxiv.org/abs/2605.01854v1
- Date: Sun, 03 May 2026 12:51:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.966931
- Title: High-Fidelity Mobile Avatars with Pruned Local Blendshapes
- Title(参考訳): Pruned Local Blendshapes を用いた高忠実度移動アバター
- Authors: Youyi Zhan, He Wang, Tianjia Shao, Kun Zhou,
- Abstract要約: 本研究では,モバイルデバイス上で動作可能な多視点ビデオから高忠実度人間のアバターを再構成する手法を提案する。
本手法は事前訓練のないエンドツーエンドの訓練手法である。
実験により,高精細度で高品質な人体アバターをレンダリングでき,モバイルデバイス上では2K解像度で120FPSに到達できることがわかった。
- 参考スコア(独自算出の注目度): 31.676318358214203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a method to reconstruct high-fidelity human avatars from multi-view video that can run on mobile devices. Many works can model high-quality Gaussian-based full-body avatars from multi-view video. However, these methods require heavy computation to obtain pose-dependent appearance, making deployment on mobile devices very difficult. Recent methods distill from pretrained models and model pose-dependent nonlinear Gaussian attributes by linearly combining global pose features with blendshapes. Although they can run on mobile devices, they suffer some loss of detail. We observe that nearby Gaussians are often highly correlated within a local region of the body, and can be linearly modeled with less error. Therefore, we use local linear blendshapes in small body parts to capture global nonlinear changes of Gaussian attributes. To further reduce computation and model size, we propose to remove blendshapes for Gaussians whose attributes change little, yielding a minimal blendshape representation. Our method is an end-to-end training method without a pretrained model. To make it run on multiple devices, we implement our method using WebGPU. Experiments show that our method can render high-quality human avatars with better details, and can reach 120 FPS at 2K resolution on mobile devices.
- Abstract(参考訳): 本研究では,モバイルデバイス上で動作可能な多視点ビデオから高忠実度人間のアバターを再構成する手法を提案する。
多くの作品は、マルチビュービデオから高品質なガウスベースのフルボディアバターをモデル化することができる。
しかし、これらの手法は、ポーズ依存の外観を得るために重い計算を必要とするため、モバイルデバイスへの展開は非常に困難である。
近年の手法では, 大域的なポーズ特徴とブレンドサップを線形に組み合わせて, 事前学習モデルとモデルポーズ依存非線型ガウス特性を抽出している。
モバイルデバイスで動かせるが、細部が失われる。
近くにあるガウス人は、しばしば身体の局所領域内で高い相関関係にあり、より少ない誤差で線形にモデル化できる。
そこで我々は, ガウス属性の大域的非線形変化を捉えるために, 小部分の局所線形ブレンドサップを用いた。
計算量とモデルサイズをさらに削減するために,特性がほとんど変化しないガウスのブレンドシャッピーを除去し,最小のブレンドシェープ表現を実現することを提案する。
本手法は事前訓練のないエンドツーエンドの訓練手法である。
複数のデバイス上で動作させるため,WebGPUを用いて本手法を実装した。
実験により,高精細度で高品質な人体アバターをレンダリングでき,モバイルデバイス上では2K解像度で120FPSに到達できることがわかった。
関連論文リスト
- GaussGym: An open-source real-to-sim framework for learning locomotion from pixels [78.05453137978132]
本稿では,3次元ガウススプラッティングをベクトル化物理シミュレータのドロップインとして統合した光現実的ロボットシミュレーションを提案する。
これにより、コンシューマGPUで毎秒10万ステップを超える、前例のないスピードを実現している。
また,シミュレーティブ・トゥ・リアル・ロボティクス・セッティングにおける適用性を実証した。
論文 参考訳(メタデータ) (2025-10-17T06:34:52Z) - LAM: Large Avatar Model for One-shot Animatable Gaussian Head [20.503641046404184]
一つの画像からガウスの頭部再構成を行うための革新的な大型アバターモデル LAM を提案する。
LAMはアニマタブルなガウスヘッドを1つのフォワードパスで生成し、追加のネットワークや後処理ステップを使わずに再現とレンダリングを可能にする。
LAMは既存のベンチマークで最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-02-25T02:57:45Z) - SqueezeMe: Mobile-Ready Distillation of Gaussian Full-Body Avatars [19.249226899376943]
本稿では,高忠実度3Dガウスフルボディアバターを軽量な表現に変換するフレームワークであるSqueezeMeを紹介する。
私たちはMeta Quest 3 VRヘッドセットで3つのガウスアバターをリアルタイムで(72FPS)同時アニメーションとレンダリングを初めて実現しました。
論文 参考訳(メタデータ) (2024-12-19T18:46:55Z) - GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers [23.96688843662126]
単眼画像からポーズ付き3次元モデルを構築することはスポーツ産業において重要な応用である。
人間の3次元ポーズと形状推定を3次元ガウススティング(3DGS)と組み合わせ,ガウスの混合シーンを表現した。
この組み合わせは、高価な拡散モデルや3Dポイントの監督なしに、1つの画像から3次元人間のモデルをほぼリアルタイムで推定できることを示す。
論文 参考訳(メタデータ) (2024-09-06T11:34:24Z) - OccGaussian: 3D Gaussian Splatting for Occluded Human Rendering [55.50438181721271]
表面レンダリングにNeRFを用いた従来手法では,閉鎖領域の復元には1日以上,閉塞領域のレンダリングには数秒を要していた。
OccGaussianは3D Gaussian Splattingをベースとして6分以内でトレーニングが可能で,最大160FPSまでの高品質な人体レンダリングを実現する。
論文 参考訳(メタデータ) (2024-04-12T13:00:06Z) - UV Gaussians: Joint Learning of Mesh Deformation and Gaussian Textures for Human Avatar Modeling [71.87807614875497]
メッシュ変形と2次元UV空間のガウステクスチャを共同学習することで3次元人体をモデル化するUVガウスアンを提案する。
我々は,多視点画像,走査モデル,パラメトリックモデル登録,およびそれに対応するテクスチャマップを含む,人間の動作の新たなデータセットを収集し,処理する。
論文 参考訳(メタデータ) (2024-03-18T09:03:56Z) - FLARE: Fast Learning of Animatable and Relightable Mesh Avatars [64.48254296523977]
私たちのゴールは、幾何学的に正確で、リアルで、楽しい、現在のレンダリングシステムと互換性のあるビデオから、パーソナライズ可能な3Dアバターを効率的に学習することです。
単眼ビデオからアニマタブルアバターとリライトブルアバターの作成を可能にする技術であるFLAREを紹介する。
論文 参考訳(メタデータ) (2023-10-26T16:13:00Z) - HQ3DAvatar: High Quality Controllable 3D Head Avatar [65.70885416855782]
本稿では,高フォトリアリスティックなデジタルヘッドアバターを構築するための新しいアプローチを提案する。
本手法はニューラルネットワークによってパラメータ化された暗黙関数を用いて標準空間を学習する。
テスト時,本手法は単眼のRGBビデオによって駆動される。
論文 参考訳(メタデータ) (2023-03-25T13:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。