論文の概要: WaveletGaussian: Wavelet-domain Diffusion for Sparse-view 3D Gaussian Object Reconstruction
- arxiv url: http://arxiv.org/abs/2509.19073v1
- Date: Tue, 23 Sep 2025 14:34:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.893166
- Title: WaveletGaussian: Wavelet-domain Diffusion for Sparse-view 3D Gaussian Object Reconstruction
- Title(参考訳): WaveletGaussian: スパースビュー3次元ガウス物体再構成のためのウェーブレット領域拡散
- Authors: Hung Nguyen, Runfa Li, An Le, Truong Nguyen,
- Abstract要約: より効率的なスパースビュー3Dガウスオブジェクト再構成のためのフレームワークであるWaveletGaussianを提案する。
我々のキーとなるアイデアは、ウェーブレット領域への拡散をシフトさせることであり、一方、高周波サブバンドは軽量ネットワークで洗練されている。
Mip-NeRF 360とOmni3Dの2つのベンチマークデータセットに対する実験は、WaveletGaussianが競合するレンダリング品質を達成したことを示している。
- 参考スコア(独自算出の注目度): 5.93524554224854
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: 3D Gaussian Splatting (3DGS) has become a powerful representation for image-based object reconstruction, yet its performance drops sharply in sparse-view settings. Prior works address this limitation by employing diffusion models to repair corrupted renders, subsequently using them as pseudo ground truths for later optimization. While effective, such approaches incur heavy computation from the diffusion fine-tuning and repair steps. We present WaveletGaussian, a framework for more efficient sparse-view 3D Gaussian object reconstruction. Our key idea is to shift diffusion into the wavelet domain: diffusion is applied only to the low-resolution LL subband, while high-frequency subbands are refined with a lightweight network. We further propose an efficient online random masking strategy to curate training pairs for diffusion fine-tuning, replacing the commonly used, but inefficient, leave-one-out strategy. Experiments across two benchmark datasets, Mip-NeRF 360 and OmniObject3D, show WaveletGaussian achieves competitive rendering quality while substantially reducing training time.
- Abstract(参考訳): 3D Gaussian Splatting (3DGS) は画像ベースのオブジェクト再構成の強力な表現となっているが、その性能はスパースビュー設定で急激に低下している。
以前の研究は、拡散モデルを用いて破損したレンダリングを修復し、その後、後の最適化のために擬似基底真理として使用することで、この制限に対処した。
効果はあるものの、拡散微調整と補修の工程から重い計算を行う。
より効率的なスパースビュー3Dガウスオブジェクト再構成のためのフレームワークであるWaveletGaussianを提案する。
拡散は低分解能LLサブバンドにのみ適用され、高周波サブバンドは軽量ネットワークで洗練される。
さらに、拡散微調整のためのトレーニングペアをキュレートする効率的なオンラインランダムマスキング戦略を提案する。
Mip-NeRF 360とOmniObject3Dという2つのベンチマークデータセットによる実験では、WaveletGaussianは、トレーニング時間を大幅に短縮しつつ、競争力のあるレンダリング品質を実現している。
関連論文リスト
- iGaussian: Real-Time Camera Pose Estimation via Feed-Forward 3D Gaussian Splatting Inversion [62.09575122593993]
iGaussianは2段階のフィードフォワードフレームワークで、直接3Dガウス変換によるリアルタイムカメラポーズ推定を実現する。
NeRF Synthetic, Mip-NeRF 360, T&T+DB データセットの実験結果から, 従来の手法に比べて大幅な性能向上が得られた。
論文 参考訳(メタデータ) (2025-11-18T05:22:22Z) - From Coarse to Fine: Learnable Discrete Wavelet Transforms for Efficient 3D Gaussian Splatting [5.026688852582894]
AutoOpti3DGSは、視覚的忠実さを犠牲にすることなく、ガウスの増殖を自動的に抑制するトレーニングタイムフレームワークである。
ウェーブレット駆動で粗大なプロセスは、冗長な微細ガウスの形成を遅らせる。
論文 参考訳(メタデータ) (2025-06-29T00:27:17Z) - RobustSplat: Decoupling Densification and Dynamics for Transient-Free 3DGS [79.15416002879239]
3D Gaussian Splattingは、ノベルビュー合成と3Dモデリングにおけるリアルタイム、フォトリアリスティックレンダリングにおいて大きな注目を集めている。
既存の手法は、過渡的なオブジェクトに影響されたシーンを正確にモデル化するのに苦労し、描画された画像のアーティファクトに繋がる。
2つの重要な設計に基づく堅牢なソリューションであるRobustSplatを提案する。
論文 参考訳(メタデータ) (2025-06-03T11:13:48Z) - 3DGEER: Exact and Efficient Volumetric Rendering with 3D Gaussians [15.776720879897345]
本稿では3DGEER(Exact and Efficient Volumetric Gaussian Rendering method)を紹介する。
提案手法は従来手法を一貫して上回り, リアルタイムなニューラルレンダリングにおける新しい最先端技術を確立する。
論文 参考訳(メタデータ) (2025-05-29T22:52:51Z) - 3D Wavelet Convolutions with Extended Receptive Fields for Hyperspectral Image Classification [12.168520751389622]
ディープニューラルネットワークは、ハイパースペクトル画像分類において多くの課題に直面している。
本稿ではウェーブレット変換と統合された改良型3D-DenseNetモデルWCNetを提案する。
実験結果から,IN,UP,KSCデータセットにおいて優れた性能を示した。
論文 参考訳(メタデータ) (2025-04-15T01:39:42Z) - 3DGUT: Enabling Distorted Cameras and Secondary Rays in Gaussian Splatting [15.124165321341646]
本研究では,EWAスプラッティングスプラッティングをアンセント変換に置き換えた3次元ガウスアンアンセント変換(3DGUT)を提案する。
これにより、自明化の効率を維持しつつ、ローリングシャッターなどの歪み時間依存効果を支持できる。
論文 参考訳(メタデータ) (2024-12-17T03:21:25Z) - CVT-xRF: Contrastive In-Voxel Transformer for 3D Consistent Radiance Fields from Sparse Inputs [65.80187860906115]
スパース入力によるNeRFの性能向上のための新しい手法を提案する。
まず, サンプル線が, 3次元空間内の特定のボクセルと交差することを保証するために, ボクセルを用いた放射線サンプリング戦略を採用する。
次に、ボクセル内の追加点をランダムにサンプリングし、トランスフォーマーを適用して各線上の他の点の特性を推測し、ボリュームレンダリングに組み込む。
論文 参考訳(メタデータ) (2024-03-25T15:56:17Z) - GES: Generalized Exponential Splatting for Efficient Radiance Field Rendering [112.16239342037714]
GES(Generalized Exponential Splatting)は、GEF(Generalized Exponential Function)を用いて3Dシーンをモデル化する斬新な表現である。
周波数変調損失の助けを借りて、GESは新規なビュー合成ベンチマークにおいて競合性能を達成する。
論文 参考訳(メタデータ) (2024-02-15T17:32:50Z) - LightGaussian: Unbounded 3D Gaussian Compression with 15x Reduction and 200+ FPS [55.85673901231235]
光ガウシアン(LightGaussian)は、3次元ガウシアンをよりコンパクトなフォーマットに変換する方法である。
ネットワーク・プルーニングにインスパイアされたLightGaussianは、ガウシアンをシーン再構築において最小限のグローバルな重要性で特定した。
LightGaussian は 3D-GS フレームワークで FPS を 144 から 237 に上げながら,平均 15 倍の圧縮率を達成する。
論文 参考訳(メタデータ) (2023-11-28T21:39:20Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - Frequency Compensated Diffusion Model for Real-scene Dehazing [6.105813272271171]
本研究では,実ヘイズへの一般化を改善する条件付き拡散モデルに基づく脱ヘイズフレームワークについて考察する。
提案手法は, 実世界の画像において, 最先端の手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2023-08-21T06:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。