論文の概要: HGC-Avatar: Hierarchical Gaussian Compression for Streamable Dynamic 3D Avatars
- arxiv url: http://arxiv.org/abs/2510.16463v1
- Date: Sat, 18 Oct 2025 12:03:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.00783
- Title: HGC-Avatar: Hierarchical Gaussian Compression for Streamable Dynamic 3D Avatars
- Title(参考訳): HGC-Avatar: スケーラブルな動的3次元アバターに対する階層型ガウス圧縮
- Authors: Haocheng Tang, Ruoke Yan, Xinhui Yin, Qi Zhang, Xinfeng Zhang, Siwei Ma, Wen Gao, Chuanmin Jia,
- Abstract要約: HGC-アバター(HGC-Avatar)は、動的アバターの効率的な伝送と高品質レンダリングのための新しい階層型ガウス圧縮フレームワークである。
我々は,HGC-Avatarが高速な3次元アバターレンダリングを実現すると同時に,視覚的品質と圧縮効率の両面で先行手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 45.746590759473435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in 3D Gaussian Splatting (3DGS) have enabled fast, photorealistic rendering of dynamic 3D scenes, showing strong potential in immersive communication. However, in digital human encoding and transmission, the compression methods based on general 3DGS representations are limited by the lack of human priors, resulting in suboptimal bitrate efficiency and reconstruction quality at the decoder side, which hinders their application in streamable 3D avatar systems. We propose HGC-Avatar, a novel Hierarchical Gaussian Compression framework designed for efficient transmission and high-quality rendering of dynamic avatars. Our method disentangles the Gaussian representation into a structural layer, which maps poses to Gaussians via a StyleUNet-based generator, and a motion layer, which leverages the SMPL-X model to represent temporal pose variations compactly and semantically. This hierarchical design supports layer-wise compression, progressive decoding, and controllable rendering from diverse pose inputs such as video sequences or text. Since people are most concerned with facial realism, we incorporate a facial attention mechanism during StyleUNet training to preserve identity and expression details under low-bitrate constraints. Experimental results demonstrate that HGC-Avatar provides a streamable solution for rapid 3D avatar rendering, while significantly outperforming prior methods in both visual quality and compression efficiency.
- Abstract(参考訳): 近年の3Dガウススティング(3DGS)の進歩により、ダイナミックな3Dシーンの高速で光リアルなレンダリングが可能となり、没入型コミュニケーションの可能性が強い。
しかし、デジタル人間の符号化と伝送では、一般的な3DGS表現に基づく圧縮方法は、人間の事前の欠如によって制限され、デコーダ側ではビットレート以下の効率と復元品質が低下し、ストリーム可能な3Dアバターシステムではその適用が妨げられる。
HGC-Avatarは,動的アバターの効率的な伝送および高品質なレンダリングを目的とした,新しい階層型ガウス圧縮フレームワークである。
提案手法はガウス表現をStyleUNetベースのジェネレータを介してガウス表現にマップする構造層と,SMPL-Xモデルを用いて時間的ポーズの変動をコンパクトかつ意味的に表現する動き層に分解する。
この階層設計は、レイヤーワイド圧縮、プログレッシブデコーディング、ビデオシーケンスやテキストなどの多様なポーズ入力からの制御可能なレンダリングをサポートする。
顔のリアリズムに最も関心があるため、StyleUNetトレーニング中に、低ビットレート制約下でのアイデンティティと表現の詳細を保存するために、顔の注意機構を組み込む。
実験結果から,HGC-Avatarは高速な3次元アバターレンダリングを実現するとともに,視覚的品質と圧縮効率の両面で先行手法よりも優れていた。
関連論文リスト
- Towards Efficient 3D Gaussian Human Avatar Compression: A Prior-Guided Framework [19.464262452201996]
本稿では,超低ビットレートで高品質な3次元アバター映像圧縮を実現するための,効率的な3次元アバター符号化フレームワークを提案する。
提案手法は従来の2D/3Dコーデックと既存の学習可能な動的3Dガウススプラッティング圧縮法を大きく上回る。
論文 参考訳(メタデータ) (2025-10-12T07:50:18Z) - TeGA: Texture Space Gaussian Avatars for High-Resolution Dynamic Head Modeling [52.87836237427514]
フォトリアルアバターは、テレプレゼンス、拡張現実、エンターテイメントにおける新興アプリケーションにおいて重要な要素であると見なされている。
本稿では,最先端の3Dヘッドアバターモデルを提案する。
論文 参考訳(メタデータ) (2025-05-08T22:10:27Z) - 3D Gaussian Head Avatars with Expressive Dynamic Appearances by Compact Tensorial Representations [41.303036354495816]
本稿では3次元ガウスのテクスチャ関連属性をテンソル形式でエンコードする表現的かつコンパクトな表現を提案する。
我々は静的な三面体に中性表現の外観を記憶し、軽量な1次元特徴線を用いて異なる表現に対して動的テクスチャの詳細を表現する。
この設計により、リアルタイムレンダリングを維持しながら正確な顔のダイナミックな詳細をキャプチャでき、ストレージコストを大幅に削減できる。
論文 参考訳(メタデータ) (2025-04-21T08:50:12Z) - SEGA: Drivable 3D Gaussian Head Avatar from a Single Image [15.117619290414064]
本稿では,3次元ドライビング可能なガウスヘッドアバターの新規な手法であるSEGAを提案する。
SEGAは、大規模な2Dデータセットから派生した先行データと、マルチビュー、マルチ圧縮、マルチIDデータから得られた3D先行データとをシームレスに結合する。
提案手法は, 一般化能力, アイデンティティ保存, 表現リアリズムにおいて, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-19T18:23:31Z) - Sequential Gaussian Avatars with Hierarchical Motion Context [7.6736633105043515]
SMPLで駆動される3DGSのヒトアバターは、フィット中のポーズから外観への複雑なマッピングにより、外観の細部を捉えるのに苦労する。
階層的な動きコンテキストに基づいて,人間のアバターをより良くモデル化するために,明示的な3DGS表現を探索するSeqAvatarを提案する。
提案手法は3DGSによるアプローチよりも優れており,最新のNeRFモデルよりも桁違いに高速に人間のアバターをレンダリングする。
論文 参考訳(メタデータ) (2024-11-25T04:05:19Z) - Generalizable and Animatable Gaussian Head Avatar [50.34788590904843]
本稿では,GAGAvatar(Generalizable and Animatable Gaussian Head Avatar)を提案する。
我々は、1つの前方通過で1つの画像から3次元ガウスのパラメータを生成する。
提案手法は, 従来の手法と比較して, 再現性や表現精度の点で優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-10T14:29:00Z) - RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models [56.13752698926105]
ポートレート画像から高忠実度3Dアバターを生成できるRodinHDを提案する。
我々はまず、多くのアバターに連続して三葉飛行機を取り付けたときに生じる破滅的な忘れの問題を特定する。
本研究では, より微細な階層表現を演算し, リッチな2次元テクスチャキューを捕捉し, 複数層での3次元拡散モデルに注入することにより, ポートレート画像の導出効果を最適化する。
三葉機用に最適化されたノイズスケジュールを持つ46Kアバターでトレーニングを行うと、得られたモデルは従来の方法よりも顕著な詳細で3Dアバターを生成することができ、内蔵機器に一般化することができる。
論文 参考訳(メタデータ) (2024-07-09T15:14:45Z) - HVTR: Hybrid Volumetric-Textural Rendering for Human Avatars [65.82222842213577]
本稿では,任意のポーズから人間の仮想アバターを効率よく,高品質に合成するニューラルレンダリングパイプラインを提案する。
まず,人体表面の高密度UV多様体上での人間の動きを符号化する。
次に、UV多様体上の符号化情報を利用して、3次元体積表現を構成する。
論文 参考訳(メタデータ) (2021-12-19T17:34:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。