論文の概要: CodecSplat: Ultra-Compact Latent Coding for Feed-Forward 3D Gaussian Splatting
- arxiv url: http://arxiv.org/abs/2605.25563v1
- Date: Mon, 25 May 2026 08:17:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.464906
- Title: CodecSplat: Ultra-Compact Latent Coding for Feed-Forward 3D Gaussian Splatting
- Title(参考訳): CodecSplat: フィードフォワード3Dガウス平滑化のための超コンパクト遅延符号化
- Authors: Pengpeng Yu, Runqing Jiang, Qi Zhang, Dingquan Li, Jing Wang, Yulan Guo,
- Abstract要約: フィードフォワード3Dガウススプラッティングのための超コンパクト遅延符号化フレームワークであるCodecSplatを紹介する。
CodecSplatは23.56-26.36 dB、24.76-27.05 dB、PSNRは20.00-10777、PSNRは3.37-12、PSNRは3.37-12である。
- 参考スコア(独自算出の注目度): 53.50198425973128
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While feed-forward 3D Gaussian splatting reconstructs renderable Gaussian primitives from sparse context views without per-scene optimization, existing pipelines do not provide a compact scene representation for storage or transmission. A natural solution is to apply existing 3DGS compression methods to the generated Gaussian primitives. However, this approach operates on the final irregular 3D representation and is decoupled from the internal feature-to-Gaussian generation process, which limits compression efficiency. To address this, we introduce CodecSplat, an ultra-compact latent coding framework for feed-forward 3D Gaussian splatting. CodecSplat first encodes an intermediate 2D Gaussian-generation feature into an entropy-coded scene bitstream. At the decoder, the latent feature is reconstructed and used to predict depth and Gaussian parameters, which are then mapped to 3D Gaussian primitives. Note that, by integrating compression into the feed-forward Gaussian generation pipeline, CodecSplat avoids inefficient compression over irregular 3D Gaussian primitives and allows the codec to exploit the structured intermediate feature representation. We instantiate CodecSplat on a feed-forward Gaussian splatting backbone with depth-guided multi-view feature refinement and a hierarchical learned feature codec. On DL3DV and RealEstate10K datasets, CodecSplat achieves 23.56-26.36 dB and 24.76-27.05 dB PSNR with only 20.00-107.77 KiB and 3.37-12.51 KiB per scene, respectively. This is roughly one order of magnitude smaller than compressing feed-forward generated Gaussian primitives, while preserving controllable rate-distortion behavior.
- Abstract(参考訳): フィードフォワード3Dガウシアンスプラッティングは、シーンごとの最適化なしに、スパースコンテキストビューからレンダリング可能なガウシアンプリミティブを再構成するが、既存のパイプラインはストレージや送信のためのコンパクトなシーン表現を提供していない。
自然な解決策は、生成されたガウス原始体に既存の3DGS圧縮法を適用することである。
しかし、このアプローチは最終的な不規則な3D表現で動作し、圧縮効率を制限する内部特徴-ガウス生成プロセスとは切り離されている。
そこで我々は,フィードフォワード3Dガウススプラッティングのための超コンパクト遅延符号化フレームワークであるCodecSplatを紹介する。
CodecSplatはまず、中間2次元ガウス生成機能をエントロピー符号化されたシーンビットストリームに符号化する。
デコーダでは、潜在機能は再構成され、深さとガウスのパラメータを予測するために使用され、3Dガウスのプリミティブにマッピングされる。
フィードフォワードガウス生成パイプラインに圧縮を統合することで、CodecSplatは不規則な3Dガウスプリミティブに対する非効率な圧縮を回避し、コーデックが構造化中間特徴表現を利用することを可能にすることに注意されたい。
CodecSplatは、奥行き誘導型マルチビュー機能改善と階層的学習機能コーデックを備えたフィードフォワードガウススプラッティングバックボーン上にインスタンス化する。
DL3DVとRealEstate10Kのデータセットでは、CodecSplatは23.56-26.36 dBと24.76-27.05 dB PSNRをそれぞれ20.00-107.77 KiBと3.37-12.51 KiBで達成している。
これは、制御可能な速度歪み挙動を保ちながら、フィードフォワード生成したガウス原始体を圧縮するよりも約1桁小さい。
関連論文リスト
- TC-GS: Tri-plane based compression for 3D Gaussian Splatting [28.502636841299356]
3D Gaussian Splatting (3DGS)は、新しいビュー合成のための顕著なフレームワークとして登場し、高い忠実度と高速なレンダリング速度を提供する。
本稿では, ガウス属性を符号化し, 圧縮に属性の分布を活かしたよく構造化された三面体を提案する。
我々のアプローチは、複数のデータセットにわたる広範な実験において、SOTA 3D Gaussian Splatting圧縮作業と同等かそれ以上の結果を得た。
論文 参考訳(メタデータ) (2025-03-26T04:26:22Z) - CAT-3DGS: A Context-Adaptive Triplane Approach to Rate-Distortion-Optimized 3DGS Compression [10.869104603083676]
3D Gaussian Splatting (3DGS)は、最近、有望な3D表現として登場した。
リモート側への3DGS表現の圧縮と送信の必要性は見落としている。
この新しいアプリケーションは、レート歪みを最適化した3DGS圧縮を要求する。
論文 参考訳(メタデータ) (2025-03-01T05:42:52Z) - PUP 3D-GS: Principled Uncertainty Pruning for 3D Gaussian Splatting [59.277480452459315]
本研究では,視覚的忠実度と前景の細部を高い圧縮比で保持する原理的感度プルーニングスコアを提案する。
また,トレーニングパイプラインを変更することなく,事前訓練した任意の3D-GSモデルに適用可能な複数ラウンドプルーファインパイプラインを提案する。
論文 参考訳(メタデータ) (2024-06-14T17:53:55Z) - CompGS: Efficient 3D Scene Representation via Compressed Gaussian Splatting [68.94594215660473]
Compressed Gaussian Splatting (CompGS) という,効率的な3次元シーン表現を提案する。
我々は少数のアンカープリミティブを予測に利用し、プリミティブの大多数を非常にコンパクトな残留形にカプセル化することができる。
実験の結果,提案手法は既存の手法よりも優れており,モデル精度とレンダリング品質を損なうことなく,3次元シーン表現のコンパクト性に優れていた。
論文 参考訳(メタデータ) (2024-04-15T04:50:39Z) - HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression [55.6351304553003]
3D Gaussian Splatting (3DGS) は、新しいビュー合成のための有望なフレームワークとして登場した。
高速な3DGS表現のためのHash-grid Assisted Context (HAC) フレームワークを提案する。
私たちの研究は、コンテキストベースの3DGS表現の圧縮を探求するパイオニアです。
論文 参考訳(メタデータ) (2024-03-21T16:28:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。