論文の概要: Hierarchical Visual Relocalization with Nearest View Synthesis from Feature Gaussian Splatting
- arxiv url: http://arxiv.org/abs/2603.29185v1
- Date: Tue, 31 Mar 2026 02:51:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.059122
- Title: Hierarchical Visual Relocalization with Nearest View Synthesis from Feature Gaussian Splatting
- Title(参考訳): 特徴ガウススプラッティングからの近距離視点合成による階層的視覚再局在
- Authors: Huaqi Tao, Bingxi Liu, Guangcheng Chen, Fulin Tang, Li He, Hong Zhang,
- Abstract要約: 視覚的再ローカライゼーションは3Dコンピュータビジョンの分野における基本的な課題であり、これまで知られていたシーンを再検討する際にカメラのポーズを推定する。
SplatHLocは,特徴ガウススプラッティングをシーン表現として用いた,新しい階層的視覚的再局在化フレームワークである。
我々は,SplatHLocが視覚的再局在の堅牢性を高め,新しい最先端技術を確立していることを示す。
- 参考スコア(独自算出の注目度): 10.178028085803833
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Visual relocalization is a fundamental task in the field of 3D computer vision, estimating a camera's pose when it revisits a previously known scene. While point-based hierarchical relocalization methods have shown strong scalability and efficiency, they are often limited by sparse image observations and weak feature matching. In this work, we propose SplatHLoc, a novel hierarchical visual relocalization framework that uses Feature Gaussian Splatting as the scene representation. To address the sparsity of database images, we propose an adaptive viewpoint retrieval method that synthesizes virtual candidates with viewpoints more closely aligned with the query, thereby improving the accuracy of initial pose estimation. For feature matching, we observe that Gaussian-rendered features and those extracted directly from images exhibit different strengths across the two-stage matching process: the former performs better in the coarse stage, while the latter proves more effective in the fine stage. Therefore, we introduce a hybrid feature matching strategy, enabling more accurate and efficient pose estimation. Extensive experiments on both indoor and outdoor datasets show that SplatHLoc enhances the robustness of visual relocalization, setting a new state-of-the-art.
- Abstract(参考訳): 視覚的再ローカライゼーションは3Dコンピュータビジョンの分野における基本的な課題であり、これまで知られていたシーンを再検討する際にカメラのポーズを推定する。
点ベースの階層的再ローカライズ手法はスケーラビリティと効率性が強いが、スパース画像観察と弱い特徴マッチングによって制限されることが多い。
本研究では,特徴ガウススティングをシーン表現として用いた新しい階層的視覚的再ローカライズフレームワークであるSplatHLocを提案する。
データベース画像の空間性に対処するため,クエリにより近い視点で仮想的候補を合成し,初期ポーズ推定の精度を向上する適応的視点検索手法を提案する。
特徴マッチングでは,ガウス的特徴と画像から直接抽出した特徴が,2段階マッチングプロセスにおいて異なる強度を示すことが観察された。
そこで我々は,より正確で効率的なポーズ推定を可能にするハイブリッドな特徴マッチング戦略を提案する。
屋内および屋外の両方のデータセットに対する大規模な実験により、SplatHLocは視覚的再局在の堅牢性を高め、新しい最先端技術を確立している。
関連論文リスト
- From Sparse to Dense: Camera Relocalization with Scene-Specific Detector from Feature Gaussian Splatting [5.731406209558667]
STDLocは完全な再ローカライゼーションパイプラインであり、前のポーズに頼ることなく正確な再ローカライゼーションを実現することができる。
STDLOCは、現在最先端のローカライゼーション手法よりも、ローカライゼーション精度とリコールの点で優れている。
論文 参考訳(メタデータ) (2025-03-25T05:18:19Z) - No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - GSplatLoc: Grounding Keypoint Descriptors into 3D Gaussian Splatting for Improved Visual Localization [1.4466437171584356]
軽量なXFeat特徴抽出器から高密度かつ堅牢なキーポイント記述器を3DGSに統合する2段階の手順を提案する。
第2段階では、レンダリングベースの光度ワープ損失を最小限に抑え、初期ポーズ推定を洗練させる。
広く使われている屋内および屋外データセットのベンチマークは、最近のニューラルレンダリングベースのローカライゼーション手法よりも改善されていることを示している。
論文 参考訳(メタデータ) (2024-09-24T23:18:32Z) - SplatLoc: 3D Gaussian Splatting-based Visual Localization for Augmented Reality [50.179377002092416]
より少ないパラメータで高品質なレンダリングが可能な効率的なビジュアルローカライズ手法を提案する。
提案手法は,最先端の暗黙的視覚的ローカライゼーションアプローチに対して,より優れた,あるいは同等なレンダリングとローカライゼーション性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T08:46:16Z) - FaVoR: Features via Voxel Rendering for Camera Relocalization [23.7893950095252]
カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。
本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。
一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文 参考訳(メタデータ) (2024-09-11T18:58:16Z) - Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - InstantSplat: Sparse-view Gaussian Splatting in Seconds [91.77050739918037]
InstantSplatは,光速でスパークビュー3Dシーンを再現する新しい手法である。
InstantSplatでは,3Dシーン表現とカメラポーズを最適化する,自己管理フレームワークを採用している。
3D-GSの従来のSfMと比較して、30倍以上の再現を達成し、視覚的品質(SSIM)を0.3755から0.7624に改善する。
論文 参考訳(メタデータ) (2024-03-29T17:29:58Z) - FSGS: Real-Time Few-shot View Synthesis using Gaussian Splatting [58.41056963451056]
本稿では,3次元ガウススプラッティングに基づく数ショットビュー合成フレームワークを提案する。
このフレームワークは3つのトレーニングビューでリアルタイムおよびフォトリアリスティックなビュー合成を可能にする。
FSGSは、さまざまなデータセットの精度とレンダリング効率の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-12-01T09:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。