論文の概要: VolSplat: Rethinking Feed-Forward 3D Gaussian Splatting with Voxel-Aligned Prediction
- arxiv url: http://arxiv.org/abs/2509.19297v1
- Date: Tue, 23 Sep 2025 17:59:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.990427
- Title: VolSplat: Rethinking Feed-Forward 3D Gaussian Splatting with Voxel-Aligned Prediction
- Title(参考訳): VolSplat:Voxel-Aligned Predictionによるフィードフォワード3Dガウスプラッティングの再考
- Authors: Weijie Wang, Yeqing Chen, Zeyu Zhang, Hengyu Liu, Haoxiao Wang, Zhiyuan Feng, Wenkang Qin, Zheng Zhu, Donny Y. Chen, Bohan Zhuang,
- Abstract要約: VolSplatは新しいマルチビューフィードフォワードパラダイムで、ピクセルアライメントとボクセルアライメントのガウスを置き換えている。
これは、画素アライメントがエラーを起こしやすい2D特徴マッチングに依存していることを克服し、堅牢なマルチビュー一貫性を確保する。
RealEstate10KやScanNetなど、広く使用されているベンチマークの実験では、VolSplatが最先端のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 45.95623374754385
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Feed-forward 3D Gaussian Splatting (3DGS) has emerged as a highly effective solution for novel view synthesis. Existing methods predominantly rely on a pixel-aligned Gaussian prediction paradigm, where each 2D pixel is mapped to a 3D Gaussian. We rethink this widely adopted formulation and identify several inherent limitations: it renders the reconstructed 3D models heavily dependent on the number of input views, leads to view-biased density distributions, and introduces alignment errors, particularly when source views contain occlusions or low texture. To address these challenges, we introduce VolSplat, a new multi-view feed-forward paradigm that replaces pixel alignment with voxel-aligned Gaussians. By directly predicting Gaussians from a predicted 3D voxel grid, it overcomes pixel alignment's reliance on error-prone 2D feature matching, ensuring robust multi-view consistency. Furthermore, it enables adaptive control over Gaussian density based on 3D scene complexity, yielding more faithful Gaussian point clouds, improved geometric consistency, and enhanced novel-view rendering quality. Experiments on widely used benchmarks including RealEstate10K and ScanNet demonstrate that VolSplat achieves state-of-the-art performance while producing more plausible and view-consistent Gaussian reconstructions. In addition to superior results, our approach establishes a more scalable framework for feed-forward 3D reconstruction with denser and more robust representations, paving the way for further research in wider communities. The video results, code and trained models are available on our project page: https://lhmd.top/volsplat.
- Abstract(参考訳): 3DGS(Feed-forward 3D Gaussian Splatting)は、新規なビュー合成のための高効率なソリューションとして登場した。
既存の手法は主に、各2Dピクセルを3Dガウスにマッピングする画素整列ガウス予測パラダイムに依存している。
入力ビューの数に大きく依存する再構成された3Dモデルをレンダリングし、ビューバイアスのある密度分布を導き、特にソースビューが閉塞や低テクスチャを含む場合のアライメントエラーを導入する。
これらの課題に対処するために、VolSplatという新しいマルチビューフィードフォワードパラダイムを導入し、画素アライメントとボクセル整列ガウスを置き換える。
予測された3Dボクセルグリッドから直接ガウスを予測することにより、エラーを起こしやすい2D特徴マッチングへの画素アライメントの依存を克服し、堅牢なマルチビュー一貫性を確保する。
さらに、3次元シーンの複雑さに基づいてガウス密度を適応的に制御でき、より忠実なガウス点雲が得られる。
RealEstate10KやScanNetなど、広く使用されているベンチマークの実験では、VolSplatは最先端のパフォーマンスを実現し、より可塑性でビューに一貫性のあるガウス的再構築を実現している。
提案手法は, より高密度で頑健な表現によるフィードフォワード3次元再構築のための, よりスケーラブルな枠組みを確立し, より広いコミュニティにおけるさらなる研究の道を開く。
ビデオの結果、コード、トレーニングされたモデルは、プロジェクトのページで公開されています。
関連論文リスト
- EVolSplat: Efficient Volume-based Gaussian Splatting for Urban View Synthesis [61.1662426227688]
既存のNeRFおよび3DGSベースの手法は、フォトリアリスティックレンダリングを実現する上で有望な結果を示すが、スローでシーンごとの最適化が必要である。
本稿では,都市景観を対象とした効率的な3次元ガウススプレイティングモデルEVolSplatを紹介する。
論文 参考訳(メタデータ) (2025-03-26T02:47:27Z) - RoGSplat: Learning Robust Generalizable Human Gaussian Splatting from Sparse Multi-View Images [39.03889696169877]
RoGSplatは、スパースマルチビュー画像から見えない人間の高忠実な新しいビューを合成するための新しいアプローチである。
提案手法は,新しいビュー合成とクロスデータセットの一般化において,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2025-03-18T12:18:34Z) - F3D-Gaus: Feed-forward 3D-aware Generation on ImageNet with Cycle-Aggregative Gaussian Splatting [35.625593119642424]
本稿では,モノケプラーデータセットから3次元認識を一般化する問題に取り組む。
画素整列型ガウススプラッティングに基づく新しいフィードフォワードパイプラインを提案する。
また,学習した3次元表現において,クロスビューの一貫性を強制する自己教師付きサイクル集約的制約を導入する。
論文 参考訳(メタデータ) (2025-01-12T04:44:44Z) - NovelGS: Consistent Novel-view Denoising via Large Gaussian Reconstruction Model [57.92709692193132]
NovelGSは、スパースビュー画像が与えられたガウススプラッティングの拡散モデルである。
我々は3Dガウスを生成するためにトランスフォーマーネットワークを経由する新しい視点を利用する。
論文 参考訳(メタデータ) (2024-11-25T07:57:17Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - HiSplat: Hierarchical 3D Gaussian Splatting for Generalizable Sparse-View Reconstruction [46.269350101349715]
HiSplatは、一般化可能な3Dガウススプラッティングのための新しいフレームワークである。
階層的な3Dガウスを粗大な戦略で生成する。
これにより、再構築品質とデータセット間の一般化が大幅に向上する。
論文 参考訳(メタデータ) (2024-10-08T17:59:32Z) - GSD: View-Guided Gaussian Splatting Diffusion for 3D Reconstruction [52.04103235260539]
単一視点からの3次元オブジェクト再構成のためのガウススプティング表現に基づく拡散モデル手法を提案する。
モデルはGS楕円体の集合で表される3Dオブジェクトを生成することを学習する。
最終的な再構成されたオブジェクトは、高品質な3D構造とテクスチャを持ち、任意のビューで効率的にレンダリングできる。
論文 参考訳(メタデータ) (2024-07-05T03:43:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。