論文の概要: CompSplat: Compression-aware 3D Gaussian Splatting for Real-world Video
- arxiv url: http://arxiv.org/abs/2602.09816v1
- Date: Tue, 10 Feb 2026 14:23:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.575836
- Title: CompSplat: Compression-aware 3D Gaussian Splatting for Real-world Video
- Title(参考訳): CompSplat:圧縮を意識した3Dガウシアン・スプレイティング
- Authors: Hojun Song, Heejung Choi, Aro Kim, Chae-yeong Song, Gahyeon Kim, Soo Ye Kim, Jaehyup Lee, Sang-hyo Park,
- Abstract要約: 文化遺産保存、デジタル双生児、没入型メディアなどの応用には、現実世界のビデオからの高品質なノベルビュー合成(NVS)が不可欠である。
本稿では,フレーム単位の圧縮特性を明示的にモデル化する圧縮対応学習フレームワークCompSplatを提案する。
- 参考スコア(独自算出の注目度): 12.1564345841374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-quality novel view synthesis (NVS) from real-world videos is crucial for applications such as cultural heritage preservation, digital twins, and immersive media. However, real-world videos typically contain long sequences with irregular camera trajectories and unknown poses, leading to pose drift, feature misalignment, and geometric distortion during reconstruction. Moreover, lossy compression amplifies these issues by introducing inconsistencies that gradually degrade geometry and rendering quality. While recent studies have addressed either long-sequence NVS or unposed reconstruction, compression-aware approaches still focus on specific artifacts or limited scenarios, leaving diverse compression patterns in long videos insufficiently explored. In this paper, we propose CompSplat, a compression-aware training framework that explicitly models frame-wise compression characteristics to mitigate inter-frame inconsistency and accumulated geometric errors. CompSplat incorporates compression-aware frame weighting and an adaptive pruning strategy to enhance robustness and geometric consistency, particularly under heavy compression. Extensive experiments on challenging benchmarks, including Tanks and Temples, Free, and Hike, demonstrate that CompSplat achieves state-of-the-art rendering quality and pose accuracy, significantly surpassing most recent state-of-the-art NVS approaches under severe compression conditions.
- Abstract(参考訳): 文化遺産保存、デジタル双生児、没入型メディアなどの応用には、現実世界のビデオからの高品質なノベルビュー合成(NVS)が不可欠である。
しかし、現実世界のビデオは、通常、不規則なカメラ軌跡と未知のポーズを持つ長いシーケンスを含んでおり、ポーズのドリフト、特徴的アライメント、再構成中の幾何学的歪みをもたらす。
さらに、損失圧縮は、幾何やレンダリング品質を徐々に劣化させる不整合を導入することでこれらの問題を増幅する。
最近の研究では、ロングシーケンスのNVSまたは未提案の再構成に対処しているが、圧縮対応のアプローチは依然として特定のアーティファクトや限られたシナリオに焦点を当てており、長いビデオに様々な圧縮パターンが不足している。
本稿では,フレーム間不整合を緩和し,幾何誤差を蓄積するフレームワイド圧縮特性を明示的にモデル化する圧縮対応学習フレームワークCompSplatを提案する。
CompSplatは圧縮を意識したフレーム重み付けと、特に重圧縮下での堅牢性と幾何的整合性を高めるための適応的なプルーニング戦略を取り入れている。
Tanks and Temples、Free、Hikeといった挑戦的なベンチマークに関する大規模な実験は、CompSplatが最先端のレンダリング品質を達成し、精度を向上し、厳しい圧縮条件下での最新の最先端NVSアプローチを著しく上回っていることを実証している。
関連論文リスト
- TinySplat: Feedforward Approach for Generating Compact 3D Scene Representation [38.50388562890992]
TinySplatは、コンパクトな3Dシーン表現を生成するための完全なフィードフォワードアプローチである。
TinySplatは標準フィードフォワード3DGS法に基づいており、トレーニング不要の圧縮フレームワークを統合している。
私たちのフレームワークはエンコーディング時間の25%とデコーディング時間の1%しか必要としません。
論文 参考訳(メタデータ) (2025-06-11T07:47:19Z) - GSCodec Studio: A Modular Framework for Gaussian Splat Compression [24.416126420899086]
GSCodec Studioは、GSの再構築、圧縮、レンダリングのための統合されたフレームワークである。
このフレームワークは多種多様な3D/4DGS再構成手法とGS圧縮技術をモジュールコンポーネントとして組み込んでいる。
GSCodec Studioは、コミュニティリサーチと独自の調査からベストプラクティスを統合することで、コンパクトな表現と圧縮ソリューションの開発を支援します。
論文 参考訳(メタデータ) (2025-06-02T16:04:25Z) - Hierarchical Semantic Compression for Consistent Image Semantic Restoration [62.97519327310638]
生成モデルから固有意味空間内で純粋に機能する新しい階層意味圧縮(HSC)フレームワークを提案する。
実験の結果,提案したHSCフレームワークは人間の視力に対する主観的品質と一貫性に関する最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2025-02-24T03:20:44Z) - Uncertainty-Aware Deep Video Compression with Ensembles [24.245365441718654]
深層アンサンブルによる予測不確かさを効果的に把握できる不確実性対応ビデオ圧縮モデルを提案する。
我々のモデルは1080pのシーケンスに比べて20%以上効率良くビットを節約できる。
論文 参考訳(メタデータ) (2024-03-28T05:44:48Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - COMISR: Compression-Informed Video Super-Resolution [76.94152284740858]
ウェブやモバイルデバイスのほとんどのビデオは圧縮され、帯域幅が制限されると圧縮は厳しい。
圧縮によるアーティファクトを導入せずに高解像度コンテンツを復元する圧縮インフォームドビデオ超解像モデルを提案する。
論文 参考訳(メタデータ) (2021-05-04T01:24:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。