論文の概要: Disambiguating 2D-3D Correspondences in Gaussian Splatting-based Feature Fields for Visual Localization
- arxiv url: http://arxiv.org/abs/2605.07351v1
- Date: Fri, 08 May 2026 07:01:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.874526
- Title: Disambiguating 2D-3D Correspondences in Gaussian Splatting-based Feature Fields for Visual Localization
- Title(参考訳): ガウススプラッティングに基づく視覚的位置推定のための特徴場における2D-3D対応の曖昧さ
- Authors: Miso Lee, Sangeek Hyun, Yerim Jeon, Jae-Pil Heo,
- Abstract要約: 本稿では,2D-3Dマッチングに光度最適化された特徴場(GSFF)が本質的に不適であることを示す。
これらの問題に対処するために,ガウス属性を利用して2D-3D対応を曖昧にする特殊な局所化フレームワークであるSplitGS-Locを提案する。
- 参考スコア(独自算出の注目度): 36.99946317601775
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Gaussian Splatting-based Feature Fields (GSFFs) have shown promise for visual localization, this paper highlights that photometrically optimized GSFFs are inherently ill-suited for 2D-3D matching. The volumetric extent of each Gaussian induces many-to-one pixel-to-point mappings that destabilize PnP-based pose estimation, while photometric optimization gives rise to superfluous Gaussians devoid of multi-view consistency. To address these issues, we propose SplitGS-Loc, a localization-specialized GSFFs construction framework that disambiguates 2D-3D correspondences by exploiting Gaussian attributes. Our key design, Mixture-of-Gaussians-based splitting, decomposes each Gaussian into smaller Gaussians, replacing ambiguous many-to-one with precise one-to-one correspondences. In parallel, we exploit composition weights from GS rasterization to select Gaussians that significantly and consistently contribute across multiple views and aggregate discriminative features through strong pixel-Gaussian associations, enforcing multi-view consistency. The resulting compact yet discriminative feature fields enable stable PnP convergence, achieving state-of-the-art performance on localization benchmarks. Extensive experiments validate that SplitGS-Loc extends the utility of photometric GSFFs to accurate and efficient localization by exploiting Gaussian attributes, without per-scene training or iterative pose refinement.
- Abstract(参考訳): ガウススプラッティングに基づく特徴場(GSFF)は視覚的局所化を約束するが,光度最適化されたGSFFは本質的に2D-3Dマッチングに不適であることを示す。
各ガウスの体積範囲は、PnPベースのポーズ推定を不安定化する多対一の画素間マッピングを誘導する一方、光度最適化は多視点一貫性を欠く超流動ガウスを生じさせる。
これらの問題に対処するために,ガウス属性を利用して2D-3D対応を曖昧にする局所化特化GSFFs構築フレームワークであるSplitGS-Locを提案する。
私たちのキーデザインであるMixture-of-Gaussianベースの分割は、各ガウス語をより小さなガウス語に分解し、曖昧な多対一対応を正確に1対1の対応に置き換える。
並行して、GSラスタ化からの合成重みを利用して、複数のビューに大きく、一貫して寄与し、強いピクセル・ガウス関係を通じて識別的特徴を集約するガウス的選択を行い、多視点整合性を実現する。
その結果、コンパクトで差別的な特徴体は安定なPnP収束を可能にし、ローカライゼーションベンチマークで最先端のパフォーマンスを達成する。
大規模な実験により、SplitGS-Locは、撮影時間ごとのトレーニングや反復的なポーズ改善なしに、ガウス属性を活用することにより、測光GSFFの有用性を正確かつ効率的なローカライゼーションに拡張した。
関連論文リスト
- NG-GS: NeRF-Guided 3D Gaussian Splatting Segmentation [65.34304674634713]
3DGSにおける高品質なオブジェクトセグメンテーションのためのフレームワークであるNG-GSを導入する。
本手法は, 境界mIoUにおいて, フォトリアリスティックな技術性能を実現し, 有意な利得が得られることを示す。
論文 参考訳(メタデータ) (2026-04-16T07:14:07Z) - GS^2: Graph-based Spatial Distribution Optimization for Compact 3D Gaussian Splatting [50.2045409672451]
3D Gaussian Splatting (3DGS)は、新しいビュー合成とリアルタイムレンダリングにおいて画期的な性能を示した。
大量のガウス点があるため、高いメモリコストに制約される。
コンパクトな3DGSのためのグラフベースの空間分布最適化を提案する。
論文 参考訳(メタデータ) (2026-04-02T10:41:51Z) - Gau-Occ: Geometry-Completed Gaussians for Multi-Modal 3D Occupancy Prediction [40.5891357994769]
Gau-Occは、密度の高いボリューム処理をバイパスするマルチモーダルフレームワークである。
幾何整列した2Dサンプリングとクロスモーダルアライメントにより、マルチビューイメージセマンティクスを統合する。
論文 参考訳(メタデータ) (2026-03-24T06:44:46Z) - F4Splat: Feed-Forward Predictive Densification for Feed-Forward 3D Gaussian Splatting [28.800888081472422]
本稿では,フィードフォワード3次元ガウス分割のためのフィードフォワード予測デンシフィケーションを行うF4Splatを提案する。
本モデルでは, 地域ごとの密度化スコアを推定し, 必要なガウス密度を推定し, 最終ガウス予算の明示的な制御を可能にする。
実験により,従来のフィードフォワード法と比較して,本モデルが優れた新規ビュー合成性能を発揮することが示された。
論文 参考訳(メタデータ) (2026-03-22T16:03:56Z) - 2D Gaussian Splatting with Semantic Alignment for Image Inpainting [46.266955851252504]
2次元ガウススプラッティングに基づく最初の画像インペイントフレームワークを提案する。
グローバルなセマンティック一貫性のために、事前訓練されたDINOモデルの特徴を取り入れる。
本手法は,定量的指標と知覚的品質の両面での競合性能を実現する。
論文 参考訳(メタデータ) (2025-09-02T05:12:52Z) - PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views [116.10577967146762]
PixelGaussianは、任意の視点から一般化可能な3Dガウス再構成を学習するための効率的なフレームワークである。
提案手法は,様々な視点によく一般化した最先端性能を実現する。
論文 参考訳(メタデータ) (2024-10-24T17:59:58Z) - MCGS: Multiview Consistency Enhancement for Sparse-View 3D Gaussian Radiance Fields [100.90743697473232]
3Dガウシアンによって表現される放射場は、高いトレーニング効率と高速レンダリングの両方を提供する、新しいビューの合成に優れている。
既存の手法では、高密度推定ネットワークからの奥行き先を組み込むことが多いが、入力画像に固有の多視点一貫性を見落としている。
スパースビューからのシーン再構成が可能な3次元ガウススプラッティングに基づくビュー合成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T08:39:05Z) - GES: Generalized Exponential Splatting for Efficient Radiance Field Rendering [112.16239342037714]
GES(Generalized Exponential Splatting)は、GEF(Generalized Exponential Function)を用いて3Dシーンをモデル化する斬新な表現である。
周波数変調損失の助けを借りて、GESは新規なビュー合成ベンチマークにおいて競合性能を達成する。
論文 参考訳(メタデータ) (2024-02-15T17:32:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。