論文の概要: Instant GaussianImage: A Generalizable and Self-Adaptive Image Representation via 2D Gaussian Splatting
- arxiv url: http://arxiv.org/abs/2506.23479v1
- Date: Mon, 30 Jun 2025 02:58:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.900229
- Title: Instant GaussianImage: A Generalizable and Self-Adaptive Image Representation via 2D Gaussian Splatting
- Title(参考訳): Instant Gaussian Image: 2D Gaussian Splattingによる一般化可能で自己適応的な画像表現
- Authors: Zhaojie Zeng, Yuesong Wang, Chao Yang, Tao Guan, Lili Ju,
- Abstract要約: 本稿では,2次元ガウス分割に基づく一般化可能で自己適応的な画像表現フレームワークを提案する。
提案手法では,粗いガウス表現を高速に生成するネットワークを用いて,最小限の微調整を行う。
我々の手法はガウス画像のレンダリング性能と非常に少ないイテレーションと短いトレーニング時間で一致または超えることを示す。
- 参考スコア(独自算出の注目度): 13.439790810504851
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Implicit Neural Representation (INR) has demonstrated remarkable advances in the field of image representation but demands substantial GPU resources. GaussianImage recently pioneered the use of Gaussian Splatting to mitigate this cost, however, the slow training process limits its practicality, and the fixed number of Gaussians per image limits its adaptability to varying information entropy. To address these issues, we propose in this paper a generalizable and self-adaptive image representation framework based on 2D Gaussian Splatting. Our method employs a network to quickly generate a coarse Gaussian representation, followed by minimal fine-tuning steps, achieving comparable rendering quality of GaussianImage while significantly reducing training time. Moreover, our approach dynamically adjusts the number of Gaussian points based on image complexity to further enhance flexibility and efficiency in practice. Experiments on DIV2K and Kodak datasets show that our method matches or exceeds GaussianImage's rendering performance with far fewer iterations and shorter training times. Specifically, our method reduces the training time by up to one order of magnitude while achieving superior rendering performance with the same number of Gaussians.
- Abstract(参考訳): Inlicit Neural Representation (INR)は画像表現の分野で目覚ましい進歩を見せているが、かなりのGPUリソースを必要としている。
Gaussian Imageは、最近、このコストを軽減するためにGussian Splattingの使用を開拓したが、遅いトレーニングプロセスは実用性を制限し、画像あたりのガウスの固定数は、様々な情報エントロピーへの適応性を制限する。
これらの問題に対処するため,本稿では,2次元ガウス分割に基づく一般化可能で自己適応的な画像表現フレームワークを提案する。
提案手法では,粗いガウス表現を高速に生成するネットワークを用いて,最小限の微調整を施し,ガウス画像のレンダリング品質を向上し,トレーニング時間を大幅に短縮する。
さらに,画像の複雑さに基づいてガウス点数を動的に調整し,より柔軟性と効率性を高める。
DIV2KとKodakデータセットの実験では、我々のメソッドはガウス画像のレンダリング性能と非常に少ないイテレーションと短いトレーニング時間で一致または超えている。
具体的には,最大1桁のトレーニング時間を短縮し,同じガウス数で優れたレンダリング性能を実現する。
関連論文リスト
- Gaussian Graph Network: Learning Efficient and Generalizable Gaussian Representations from Multi-view Images [12.274418254425019]
3D Gaussian Splatting (3DGS) は印象的なビュー合成性能を示した。
本稿ではガウスグラフネットワーク(GGN)を提案し,効率よく一般化可能なガウスグラフを生成する。
我々は大規模なRealEstate10KとACIDデータセットの実験を行い、本手法の効率性と一般化を実証した。
論文 参考訳(メタデータ) (2025-03-20T16:56:13Z) - EigenGS Representation: From Eigenspace to Gaussian Image Space [20.454762899389358]
EigenGSは、固有空間と画像空間のガウス表現を接続する効率的な変換パイプラインである。
EigenGSは直接2次元ガウスフィッティングよりも優れた再現性が得られることを示す。
結果は,様々な解像度と多様なカテゴリを持つ画像に対して,EigenGSの有効性と一般化能力を強調した。
論文 参考訳(メタデータ) (2025-03-10T15:27:03Z) - Pixel to Gaussian: Ultra-Fast Continuous Super-Resolution with 2D Gaussian Modeling [50.34513854725803]
Arbitrary-scale Super- resolution (ASSR) は、低解像度(LR)入力から任意のアップサンプリング係数で高解像度(HR)イメージを再構成することを目的としている。
本稿では,Gaussian Splattingを用いたLR画像から2次元連続HR信号を明示的に再構成する,Pixel-to-Gaussianパラダイムを用いた新しいContinuousSRフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-09T13:43:57Z) - Efficient Gaussian Splatting for Monocular Dynamic Scene Rendering via Sparse Time-Variant Attribute Modeling [64.84686527988809]
Deformable Gaussian Splattingは、現実世界のダイナミックなシーンを表現する堅牢なソリューションとして登場した。
提案手法は,古典的カーネル表現を用いて計算された密度ガウスの運動流を用いて,スパースアンカーグリッド表現を用いて動的シーンを定式化する。
2つの実世界のデータセットの実験により、EDGSはレンダリング速度を大幅に改善し、より優れたレンダリング品質を実現しています。
論文 参考訳(メタデータ) (2025-02-27T18:53:06Z) - GaussianToken: An Effective Image Tokenizer with 2D Gaussian Splatting [64.84383010238908]
本稿では,2次元ガウススプラッティングを解法とする効果的な画像トークン化手法を提案する。
一般に、我々のフレームワークは、2次元ガウス分布の局所的な影響を離散空間に統合する。
CIFAR, Mini-Net, ImageNet-1K 上での競合的再構成性能は,我々のフレームワークの有効性を示す。
論文 参考訳(メタデータ) (2025-01-26T17:56:11Z) - PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views [116.10577967146762]
PixelGaussianは、任意の視点から一般化可能な3Dガウス再構成を学習するための効率的なフレームワークである。
提案手法は,様々な視点によく一般化した最先端性能を実現する。
論文 参考訳(メタデータ) (2024-10-24T17:59:58Z) - AdR-Gaussian: Accelerating Gaussian Splatting with Adaptive Radius [38.774337140911044]
3D Gaussian Splatting (3DGS)は、複雑なシーンの高品質な再構成とリアルタイムレンダリングを実現した、最近の明示的な3D表現である。
本稿では,AdR-Gaussianを提案する。これは並列カリングを実現するために,Renderステージのシリアルカリングの一部を前処理ステージに移動させる。
私たちのコントリビューションは3倍で、レンダリング速度は310%で、最先端技術よりも同等かそれ以上品質を維持しています。
論文 参考訳(メタデータ) (2024-09-13T09:32:38Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.598772767324036]
本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。