論文の概要: GaussianZoom: Progressive Zoom-in Generative 3D Gaussian Splatting with Geometric and Semantic Guidance
- arxiv url: http://arxiv.org/abs/2605.18252v1
- Date: Mon, 18 May 2026 11:52:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.505753
- Title: GaussianZoom: Progressive Zoom-in Generative 3D Gaussian Splatting with Geometric and Semantic Guidance
- Title(参考訳): GaussianZoom:Geometric and Semantic Guidanceを用いたプログレッシブ・ズームイン生成3Dガウススプラッティング
- Authors: Jiale Shi, Jiarui Hu, Zesong Yang, Kaixuan Luan, Hujun Bao, Zhaopeng Cui,
- Abstract要約: 低解像度入力からの高忠実度極端ズームインレンダリングを実現するために,反復的なプログレッシブ・フレームワークを備えた生成型ズームイン3D再構成システムを提案する。
Mip-NeRF360 と Tanks&Temples の実験により、ガウシアンズームは極大化下での知覚品質、多視点整合性、堅牢性に優れることを示した。
- 参考スコア(独自算出の注目度): 55.14874423865652
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce GaussianZoom, a generative zoom-in 3D reconstruction system with an iterative progressive framework that combines geometry-consistent scene modeling and multi-scale semantic reasoning to enable high-fidelity extreme zoom-in rendering from low-resolution inputs. To achieve this, we develop a novel multi-view consistent super-resolution module with depth-based feature warping and VLM-driven detail synthesis, ensuring accurate multi-view correspondence while enriching fine-scale appearance beyond the observed resolution. To support zooming across large magnification ranges, we further introduce a new expandable continuous Level-of-Detail hierarchy that dynamically modulates Gaussian visibility for smooth, alias-free cross-scale rendering. Experiments on Mip-NeRF360 and Tanks\&Temples demonstrate that GaussianZoom achieves superior perceptual quality, multi-view consistency, and robustness under extreme magnification, establishing a strong baseline for generative zoom-in 3D scene reconstruction.
- Abstract(参考訳): 低解像度入力からの高忠実度極端ズームインレンダリングを実現するために、幾何一貫性のあるシーンモデリングとマルチスケールセマンティック推論を組み合わせた反復的プログレッシブ・フレームワークを備えた3次元再生システムであるGaussianZoomを紹介した。
これを実現するため,我々は,深度に基づく特徴ワープとVLMによる詳細合成を併用した新しいマルチビュー一貫した超解像モジュールを開発した。
さらに,拡大可能な連続レベル・オブ・ディテール階層を導入し,ガウスの視認性を動的に調整し,スムーズでエイリアスフリーなクロススケールレンダリングを実現する。
Mip-NeRF360 と Tanks\&Temples の実験では、GussianZoom は極端倍率下で優れた知覚品質、マルチビュー整合性、ロバスト性を実現し、生成的なズームイン3Dシーン再構成のための強力なベースラインを確立している。
関連論文リスト
- High-Fidelity Surface Splatting-Based 3D Reconstruction from Multi-View Images [0.0]
Implicit moving Least Squares (IMLS) は、点雲を符号付き距離とテクスチャ場へ直接変換することができる。
ローカルサポートと柔軟性が向上し、周波数コンテンツの制御性が向上したコンパクトカーネルを導入する。
実験では、表面の再構成とレンダリングの両方において最先端の性能を示し、より正確な幾何学とよりシャープな視覚を与える。
論文 参考訳(メタデータ) (2026-05-08T05:23:28Z) - C3G: Learning Compact 3D Representations with 2K Gaussians [55.04010158339562]
近年の手法では3次元ガウススプラッティングを再構成に用い, シーン理解のための2D-to-3D機能昇降ステージが提案されている。
提案するC3Gは,空間的にのみコンパクトな3次元ガウスを推定する新しいフィードフォワードフレームワークである。
論文 参考訳(メタデータ) (2025-12-03T17:59:05Z) - MetroGS: Efficient and Stable Reconstruction of Geometrically Accurate High-Fidelity Large-Scale Scenes [20.601722393809244]
複雑な都市環境における効率的で堅牢な復興のための新しいフレームワークであるMetroGSを紹介する。
本手法は,分散2次元ガウススプラッティング表現を基本基盤として構築する。
大規模な都市データセットの実験により、MetroGSはより優れた幾何学的精度、レンダリング品質を達成することが示された。
論文 参考訳(メタデータ) (2025-11-24T14:34:19Z) - Gesplat: Robust Pose-Free 3D Reconstruction via Geometry-Guided Gaussian Splatting [21.952325954391508]
本稿では、3DGSベースのフレームワークであるGesplatを紹介し、ロバストな新しいビュー合成と、未提示のスパース画像からの幾何的に一貫した再構成を可能にする。
提案手法は,他のポーズフリー手法と比較して,前方および大規模の複雑なデータセット上でより堅牢な性能を実現する。
論文 参考訳(メタデータ) (2025-10-11T08:13:46Z) - MuGS: Multi-Baseline Generalizable Gaussian Splatting Reconstruction [32.14335364083271]
新規なビュー合成のためのフィードフォワードアプローチであるMulti-Baseline Gaussian Splatting (MuGS)を提案する。
MuGSは、小さなベースラインと大きなベースラインの両方でスパース入力ビューを含む、多様なベースライン設定を効果的に処理する。
LLFFおよびMip-NeRF 360データセットにおけるゼロショット性能を実証した。
論文 参考訳(メタデータ) (2025-08-06T10:34:24Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - MVGamba: Unify 3D Content Generation as State Space Sequence Modeling [150.80564081817786]
本稿では,多視点ガウス再構成器を備えた一般軽量ガウス再構成モデルMVGambaを紹介する。
オフザディテールのマルチビュー拡散モデルを統合することで、MVGambaは単一の画像、スパース画像、テキストプロンプトから3D生成タスクを統一する。
実験により、MVGambaは、すべての3Dコンテンツ生成シナリオで最先端のベースラインを約0.1タイムのモデルサイズで上回ります。
論文 参考訳(メタデータ) (2024-06-10T15:26:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。