論文の概要: GFix: Perceptually Enhanced Gaussian Splatting Video Compression
- arxiv url: http://arxiv.org/abs/2511.06953v1
- Date: Mon, 10 Nov 2025 11:03:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.209843
- Title: GFix: Perceptually Enhanced Gaussian Splatting Video Compression
- Title(参考訳): GFix:ガウスの動画圧縮を視覚的に強化
- Authors: Siyue Teng, Ge Gao, Duolikun Danier, Yuxuan Jiang, Fan Zhang, Thomas Davis, Zoe Liu, David Bull,
- Abstract要約: 既存の3DGSベースのビデオコーデックは、より目立った視覚的アーティファクトと比較的低い圧縮比を示す。
本稿では,3DGSのレンダリングと量子化の成果物が拡散訓練中に採取した雑音に類似しているという仮定に基づいて,3DGSによる映像圧縮の知覚的向上を特に狙う。
本稿では,市販のニューラルエンハンサーとして機能する,一段拡散モデルの合理化によるコンテンツ適応型フレームワークGFixを提案する。
- 参考スコア(独自算出の注目度): 16.637492219941446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D Gaussian Splatting (3DGS) enhances 3D scene reconstruction through explicit representation and fast rendering, demonstrating potential benefits for various low-level vision tasks, including video compression. However, existing 3DGS-based video codecs generally exhibit more noticeable visual artifacts and relatively low compression ratios. In this paper, we specifically target the perceptual enhancement of 3DGS-based video compression, based on the assumption that artifacts from 3DGS rendering and quantization resemble noisy latents sampled during diffusion training. Building on this premise, we propose a content-adaptive framework, GFix, comprising a streamlined, single-step diffusion model that serves as an off-the-shelf neural enhancer. Moreover, to increase compression efficiency, We propose a modulated LoRA scheme that freezes the low-rank decompositions and modulates the intermediate hidden states, thereby achieving efficient adaptation of the diffusion backbone with highly compressible updates. Experimental results show that GFix delivers strong perceptual quality enhancement, outperforming GSVC with up to 72.1% BD-rate savings in LPIPS and 21.4% in FID.
- Abstract(参考訳): 3D Gaussian Splatting (3DGS)は、明示的な表現と高速レンダリングによって3Dシーンの再構築を強化し、ビデオ圧縮を含む様々な低レベルの視覚タスクに潜在的な利点を示す。
しかし、既存の3DGSベースのビデオコーデックは、一般的に目立った視覚的アーティファクトと比較的低い圧縮比を示す。
本稿では,3DGSのレンダリングと量子化の成果物が拡散訓練中に採取した雑音に類似しているという仮定に基づいて,3DGSによる映像圧縮の知覚的向上を特に狙う。
この前提に基づいて,市販のニューラルエンハンサーとして機能する一段拡散モデルの合理化を含む,コンテンツ適応型フレームワークGFixを提案する。
さらに, 圧縮効率を向上させるため, 低ランク分解を凍結し, 中間隠蔽状態を変調し, 高圧縮性更新による拡散バックボーンの効率的な適応を実現する変調LoRA方式を提案する。
実験の結果、GFixは強い知覚品質の向上をもたらし、GSVCを72.1%のLPIPS、21.4%のFIDで上回った。
関連論文リスト
- Leveraging Learned Image Prior for 3D Gaussian Compression [47.29061692878941]
圧縮による品質劣化を回復するために,学習画像の強力な表現能力を活用する新しい3DGS圧縮フレームワークを提案する。
我々のフレームワークは既存のガウス圧縮手法と互換性があり、様々なベースラインに広く適用できるように設計されている。
論文 参考訳(メタデータ) (2025-10-16T14:10:02Z) - ExGS: Extreme 3D Gaussian Compression with Diffusion Priors [60.7245825868903]
エクストリーム3DGS圧縮のためのExGSとGaussPainterを紹介する。
GassPainterは、欠落した領域を埋め、可視画素を強化し、劣化したレンダリングを大幅に改善する。
私たちのフレームワークは100X圧縮(典型的な354.77MBモデルから約3.31MBまで)も達成できます。
論文 参考訳(メタデータ) (2025-09-29T13:23:06Z) - 3DGS-VBench: A Comprehensive Video Quality Evaluation Benchmark for 3DGS Compression [9.900921811495213]
3DGS-VBenchは大規模なビデオ品質アセスメント(VQA)データセットであり、ベンチマークには660の圧縮された3DGSモデルと11のシーンから生成されたビデオシーケンスがある。
ストレージ効率と視覚的品質に関する6つの3DGS圧縮アルゴリズムをベンチマークし、複数のパラダイムにまたがる15の品質評価指標を評価した。
論文 参考訳(メタデータ) (2025-08-09T16:47:19Z) - 3DGabSplat: 3D Gabor Splatting for Frequency-adaptive Radiance Field Rendering [50.04967868036964]
3D Gaussian Splatting(3DGS)は、高忠実なノベルビュー合成を維持しながらリアルタイムレンダリングを実現している。
複数方向の3次元周波数応答を持つ新規な3次元ガボルベースプリミティブを組み込んだ3次元ガボルスプレート(3DGabSplat)を提案する。
我々は3D以上の1.35dBRゲインを実現し、同時にプリミティブメモリ消費量を削減した。
論文 参考訳(メタデータ) (2025-08-07T12:49:44Z) - Adaptive 3D Gaussian Splatting Video Streaming [28.283254336752602]
本稿では,3DGSボリュームビデオストリーミングのための革新的なフレームワークを提案する。
ハイブリット・サリエンシ・タイリングと差別化品質・モデリングを用いて、効率的なデータ圧縮と帯域幅変動への適応を実現する。
提案手法は,映像品質,圧縮効率,伝送速度など,様々な面で既存手法よりも優れていた。
論文 参考訳(メタデータ) (2025-07-19T01:45:24Z) - D-FCGS: Feedforward Compression of Dynamic Gaussian Splatting for Free-Viewpoint Videos [12.24209693552492]
自由視点ビデオ(FVV)は没入型3D体験を可能にするが、動的3D表現の効率的な圧縮は依然として大きな課題である。
本稿では,時間的に相関したガウス点雲列を圧縮する新しいフィードフォワードフレームワークである動的ガウス散乱(D-FCGS)のフィードフォワード圧縮を提案する。
実験の結果,最適化手法の速度歪み特性と一致し,40倍以上の圧縮を2秒以内で達成した。
論文 参考訳(メタデータ) (2025-07-08T10:39:32Z) - Fast Feedforward 3D Gaussian Splatting Compression [55.149325473447384]
3D Gaussian Splatting (FCGS) は、1つのフィードフォワードパスで3DGS表現を高速に圧縮できる最適化フリーモデルである。
FCGSは圧縮比を20倍以上に向上し、高精細度を維持しながら、ほとんどのシーン毎のSOTA最適化手法を上回ります。
論文 参考訳(メタデータ) (2024-10-10T15:13:08Z) - LapisGS: Layered Progressive 3D Gaussian Splatting for Adaptive Streaming [4.209963145038135]
XRは3Dオンライン世界の効率的なストリーミングを必要とし、帯域幅に制約のある環境に適応するために現在の3DGS表現に挑戦する。
本稿では,適応ストリーミングとプログレッシブレンダリングをサポートする階層型3DGSであるLapisGSを提案する。
論文 参考訳(メタデータ) (2024-08-27T07:06:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。