論文の概要: SmartSplat: Feature-Smart Gaussians for Scalable Compression of Ultra-High-Resolution Images
- arxiv url: http://arxiv.org/abs/2512.20377v1
- Date: Tue, 23 Dec 2025 14:00:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.899484
- Title: SmartSplat: Feature-Smart Gaussians for Scalable Compression of Ultra-High-Resolution Images
- Title(参考訳): SmartSplat:超高解像度画像のスケーラブル圧縮のための機能スマートガウス
- Authors: Linfei Li, Lin Zhang, Zhong Wang, Ying Shen,
- Abstract要約: 生成AIの最近の進歩は、超高解像度視覚コンテンツの生産を加速させている。
既存の手法では,超高分解能シナリオにおける圧縮比と再現率のバランスをとるのに苦労している。
本稿では,高い適応性と特徴を考慮したGSベースの画像圧縮フレームワークであるSmartSplatを提案する。
- 参考スコア(独自算出の注目度): 12.867211140172005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in generative AI have accelerated the production of ultra-high-resolution visual content, posing significant challenges for efficient compression and real-time decoding on end-user devices. Inspired by 3D Gaussian Splatting, recent 2D Gaussian image models improve representation efficiency, yet existing methods struggle to balance compression ratio and reconstruction fidelity in ultra-high-resolution scenarios. To address this issue, we propose SmartSplat, a highly adaptive and feature-aware GS-based image compression framework that supports arbitrary image resolutions and compression ratios. SmartSplat leverages image-aware features such as gradients and color variances, introducing a Gradient-Color Guided Variational Sampling strategy together with an Exclusion-based Uniform Sampling scheme to improve the non-overlapping coverage of Gaussian primitives in pixel space. In addition, we propose a Scale-Adaptive Gaussian Color Sampling method to enhance color initialization across scales. Through joint optimization of spatial layout, scale, and color initialization, SmartSplat efficiently captures both local structures and global textures using a limited number of Gaussians, achieving high reconstruction quality under strong compression. Extensive experiments on DIV8K and a newly constructed 16K dataset demonstrate that SmartSplat consistently outperforms state-of-the-art methods at comparable compression ratios and exceeds their compression limits, showing strong scalability and practical applicability. The code is publicly available at https://github.com/lif314/SmartSplat.
- Abstract(参考訳): 生成AIの最近の進歩は、超高解像度のビジュアルコンテンツの生産を加速させ、効率的な圧縮とエンドユーザデバイスでのリアルタイムデコーディングに重大な課題を提起している。
3D Gaussian Splattingにインスパイアされた最近の2D Gaussian画像モデルは表現効率を改善するが、既存の手法では超高分解能シナリオにおける圧縮比と再現率のバランスがとれない。
この問題に対処するために、任意の画像解像度と圧縮比をサポートする、高度に適応的で特徴対応のGSベースの画像圧縮フレームワークであるSmartSplatを提案する。
SmartSplatは、勾配や色差などの画像認識機能を活用し、グラディエントカラーガイド付き変分サンプリング戦略と、排他的に基づく統一サンプリングスキームを導入し、画素空間におけるガウス的プリミティブの非重複カバレッジを改善する。
さらに,スケールをまたいだ色初期化を促進するために,スケール適応型ガウス色サンプリング法を提案する。
空間配置、スケール、色の初期化を共同で最適化することで、SmartSplatは限られた数のガウスを用いて局所構造とグローバルテクスチャの両方を効率的に捕捉し、強い圧縮下で高い再現品質を達成する。
DIV8Kと新たに構築された16Kデータセットの大規模な実験により、SmartSplatは同等の圧縮比で最先端のメソッドを一貫して上回り、圧縮限界を超え、スケーラビリティと実用的な適用性を示している。
コードはhttps://github.com/lif314/SmartSplatで公開されている。
関連論文リスト
- IBGS: Image-Based Gaussian Splatting [17.07390802338029]
3D Gaussian Splatting (3DGS) は、新しいビュー合成(NVS)の高速かつ高品質な方法として最近登場した。
我々は、高解像度のソース画像を細部やビュー固有の色モデリングに活用する効率的な画像ベースガウススプラッティングを提案する。
標準NVSベンチマーク実験では,ストレージのフットプリントを増大させることなく,ガウススプラッティング手法のレンダリング精度において,本手法が大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-11-18T11:03:27Z) - ExGS: Extreme 3D Gaussian Compression with Diffusion Priors [60.7245825868903]
エクストリーム3DGS圧縮のためのExGSとGaussPainterを紹介する。
GassPainterは、欠落した領域を埋め、可視画素を強化し、劣化したレンダリングを大幅に改善する。
私たちのフレームワークは100X圧縮(典型的な354.77MBモデルから約3.31MBまで)も達成できます。
論文 参考訳(メタデータ) (2025-09-29T13:23:06Z) - Perceive-Sample-Compress: Towards Real-Time 3D Gaussian Splatting [7.421996491601524]
本稿では,3次元ガウス平滑化のための新しい知覚・サンプル圧縮フレームワークを提案する。
提案手法は,リアルタイムレンダリング速度を維持しながら,メモリ効率と視覚的品質を大幅に向上することを示す。
論文 参考訳(メタデータ) (2025-08-07T01:34:38Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.598772767324036]
本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。