論文の概要: PAGaS: Pixel-Aligned 1DoF Gaussian Splatting for Depth Refinement
- arxiv url: http://arxiv.org/abs/2604.22129v1
- Date: Fri, 24 Apr 2026 00:29:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.296051
- Title: PAGaS: Pixel-Aligned 1DoF Gaussian Splatting for Depth Refinement
- Title(参考訳): PAGaS:深度微細化のための1DoFガウス平板
- Authors: David Recasens, Robert Maier, Aljaz Bozic, Stephane Grabli, Javier Civera, Tony Tung, Edmond Boyer,
- Abstract要約: ガウススプラッティング(GS)は、高品質な新規ビュー合成のための効率的なアプローチとして登場した。
我々は、新しいビュー合成から多視点ステレオ深度タスクへのGS表現を適応させる1DoFガウス格子(PAGaS)を提案する。
- 参考スコア(独自算出の注目度): 22.163005194153897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gaussian Splatting (GS) has emerged as an efficient approach for high-quality novel view synthesis. While early GS variants struggled to accurately model the scene's geometry, recent advancements constraining the Gaussians' spread and shapes, such as 2D Gaussian Splatting, have significantly improved geometric fidelity. In this paper, we present Pixel-Aligned 1DoF Gaussian Splatting (PAGaS) that adapts the GS representation from novel view synthesis to the multi-view stereo depth task. Our key contribution is modeling a pixel's depth using one-degree-of-freedom (1DoF) Gaussians that remain tightly constrained during optimization. Unlike existing approaches, our Gaussians' positions and sizes are restricted by the back-projected pixel volumes, leaving depth as the sole degree of freedom to optimize. PAGaS produces highly detailed depths, as illustrated in Figure 1. We quantitatively validate these improvements on top of reference geometric and learning-based multi-view stereo baselines on challenging 3D reconstruction benchmarks. Code: davidrecasens.github.io/pagas
- Abstract(参考訳): ガウススプラッティング(GS)は、高品質な新規ビュー合成のための効率的なアプローチとして登場した。
初期のGSの変種はシーンの幾何を正確にモデル化するのに苦労したが、近年のガウスの広がりと2Dガウススプラッティングのような形状の進歩は、幾何学的忠実性を大幅に改善した。
本稿では,新しいビュー合成から多視点ステレオ深度タスクへGS表現を適応させる1DoFガウス格子(PAGaS)を提案する。
我々の重要な貢献は、最適化中に厳密に拘束された1自由度ガウス (1DoF) を用いてピクセルの深さをモデル化することである。
既存のアプローチとは異なり、ガウシアンの位置とサイズはバックプロジェクションされたピクセルボリュームによって制限されており、深さを最適化する唯一の自由度として残している。
PAGaSは図1に示すように、非常に詳細な深度を生成する。
我々は,これらの改良を,参照幾何および学習に基づく多視点ステレオベースライン上で,挑戦的な3次元再構成ベンチマーク上で定量的に検証する。
コード: davidrecasens.github.io/pagas
関連論文リスト
- PointSplat: Efficient Geometry-Driven Pruning and Transformer Refinement for 3D Gaussian Splatting [2.5823344978857388]
3D Gaussian Splattingは最近、明示的な3Dプリミティブを使用してシーンを表現することによって、リアルタイムで高忠実なノベルビュー合成をアンロックした。
従来の手法では複雑なシーンを捉えるために何百万人ものガウシアンを必要とすることが多く、メモリとストレージの要求が大きくなった。
近年のアプローチでは、ガウスパラメータのプルーニングとシーン毎の微調整によってこの問題に対処し、視覚的品質を維持しながらモデルサイズを削減している。
論文 参考訳(メタデータ) (2026-04-10T20:56:18Z) - AnchorSplat: Feed-Forward 3D Gaussian Splatting with 3D Geometric Priors [23.943522711585597]
シーンレベルの再構築のための新しいフィードフォワード3DGSフレームワークであるAnchorSplatを提案する。
アンカーアラインのガウス表現は3次元幾何学的先行によって導かれる。
設計により、必要なガウス人の数は大幅に減少する。
論文 参考訳(メタデータ) (2026-04-08T13:04:54Z) - VolSplat: Rethinking Feed-Forward 3D Gaussian Splatting with Voxel-Aligned Prediction [45.95623374754385]
VolSplatは新しいマルチビューフィードフォワードパラダイムで、ピクセルアライメントとボクセルアライメントのガウスを置き換えている。
これは、画素アライメントがエラーを起こしやすい2D特徴マッチングに依存していることを克服し、堅牢なマルチビュー一貫性を確保する。
RealEstate10KやScanNetなど、広く使用されているベンチマークの実験では、VolSplatが最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-09-23T17:59:02Z) - RoGSplat: Learning Robust Generalizable Human Gaussian Splatting from Sparse Multi-View Images [39.03889696169877]
RoGSplatは、スパースマルチビュー画像から見えない人間の高忠実な新しいビューを合成するための新しいアプローチである。
提案手法は,新しいビュー合成とクロスデータセットの一般化において,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2025-03-18T12:18:34Z) - CityGaussianV2: Efficient and Geometrically Accurate Reconstruction for Large-Scale Scenes [53.107474952492396]
CityGaussianV2は大規模なシーン再構築のための新しいアプローチである。
分解段階の密度化・深さ回帰手法を実装し, ぼやけたアーチファクトを除去し, 収束を加速する。
本手法は, 視覚的品質, 幾何学的精度, ストレージ, トレーニングコストの両立を図っている。
論文 参考訳(メタデータ) (2024-11-01T17:59:31Z) - PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views [116.10577967146762]
PixelGaussianは、任意の視点から一般化可能な3Dガウス再構成を学習するための効率的なフレームワークである。
提案手法は,様々な視点によく一般化した最先端性能を実現する。
論文 参考訳(メタデータ) (2024-10-24T17:59:58Z) - GVGEN: Text-to-3D Generation with Volumetric Representation [89.55687129165256]
3Dガウススプラッティングは、高速で高品質なレンダリング機能で知られる3D再構成と生成のための強力な技術として登場した。
本稿では,テキスト入力から3次元ガウス表現を効率的に生成する新しい拡散型フレームワークGVGENを提案する。
論文 参考訳(メタデータ) (2024-03-19T17:57:52Z) - GVA: Reconstructing Vivid 3D Gaussian Avatars from Monocular Videos [56.40776739573832]
モノクロビデオ入力(GVA)から鮮明な3Dガウスアバターの作成を容易にする新しい手法を提案する。
私たちのイノベーションは、高忠実な人体再構築を実現するという、複雑な課題に対処することにあります。
通常の地図とシルエットを整列させて手足のポーズ精度を向上させるためにポーズ改善手法を提案する。
論文 参考訳(メタデータ) (2024-02-26T14:40:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。