論文の概要: PlanaReLoc: Camera Relocalization in 3D Planar Primitives via Region-Based Structure Matching
- arxiv url: http://arxiv.org/abs/2603.20818v1
- Date: Sat, 21 Mar 2026 13:30:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.100852
- Title: PlanaReLoc: Camera Relocalization in 3D Planar Primitives via Region-Based Structure Matching
- Title(参考訳): PlanaReLoc: 地域構造マッチングによる3次元平面プリミティブのカメラ再局在
- Authors: Hanqiao Ye, Yuzhou Liu, Yangdong Liu, Shuhan Shen,
- Abstract要約: 我々は,平面プリミティブと3次元平面マップを用いた軽量6-DoFカメラ再位置推定の先駆者となった。
PlanaReLocは、深いマーカがクエリイメージと学習された統合埋め込み空間内のマップに平面プリミティブを関連付ける、合理化された平面中心のパラダイムである。
- 参考スコア(独自算出の注目度): 21.698140922880402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While structure-based relocalizers have long strived for point correspondences when establishing or regressing query-map associations, in this paper, we pioneer the use of planar primitives and 3D planar maps for lightweight 6-DoF camera relocalization in structured environments. Planar primitives, beyond being fundamental entities in projective geometry, also serve as region-based representations that encapsulate both structural and semantic richness. This motivates us to introduce PlanaReLoc, a streamlined plane-centric paradigm where a deep matcher associates planar primitives across the query image and the map within a learned unified embedding space, after which the 6-DoF pose is solved and refined under a robust framework. Through comprehensive experiments on the ScanNet and 12Scenes datasets across hundreds of scenes, our method demonstrates the superiority of planar primitives in facilitating reliable cross-modal structural correspondences and achieving effective camera relocalization without requiring realistically textured/colored maps, pose priors, or per-scene training. The code and data are available at https://github.com/3dv-casia/PlanaReLoc .
- Abstract(参考訳): 構造に基づく再ローカライザは,クエリマップアソシエーションの確立や回帰において,長い間ポイント対応に取り組んできたが,本論文では,軽量6-DoFカメラ再ローカライズのための平面プリミティブと3次元平面マップの先駆的利用について述べる。
平面プリミティブは、射影幾何学の基本的な実体を超えて、構造的および意味的リッチ性の両方をカプセル化する領域ベースの表現としても機能する。
これは、深いマーカがクエリイメージと学習された統合埋め込み空間内のマップとを関連付けるような、平面中心の合理化パラダイムであるPlanaReLocを導入し、6-DoFのポーズを堅牢なフレームワークで解決し、洗練する動機である。
ScanNetと12Scenesのデータセットを数百のシーンで総合的に実験することにより、信頼性の高いクロスモーダルな構造対応を容易にし、現実的なテクスチャ/カラーマップ、ポーズ先、シーンごとのトレーニングを必要とせず、効果的なカメラ再ローカライゼーションを実現する上で、平面プリミティブの優位性を実証した。
コードとデータはhttps://github.com/3dv-casia/PlanaReLoc で公開されている。
関連論文リスト
- Interacted Planes Reveal 3D Line Mapping [73.60851338875962]
LiP-Mapは3Dラインマッピングのためのラインプレーン共同最適化フレームワークである。
ScanNetV2, ScanNet++, Hypersim, 7Scenes, Tanks&Templeの100以上のシーンにおいて、LiP-Mapは最先端メソッドよりも正確性と完全性の両方を改善している。
論文 参考訳(メタデータ) (2026-02-01T15:52:55Z) - PLANA3R: Zero-shot Metric Planar 3D Reconstruction via Feed-Forward Planar Splatting [56.188624157291024]
提案するPLANA3Rは,提案しない2次元画像から平面3次元再構成を計測するためのポーズレスフレームワークである。
トレーニング中に3次元平面アノテーションを必要とする以前のフィードフォワード法とは異なり、PLANA3Rは明確な平面監督なしで平面3次元構造を学習する。
本研究は,複数の室内環境データセットに対するPLANA3Rの有効性を検証するとともに,領域外屋内環境への強力な一般化を実証する。
論文 参考訳(メタデータ) (2025-10-21T15:15:33Z) - GSPlane: Concise and Accurate Planar Reconstruction via Structured Representation [30.083162532688096]
GSPlaneは正確な形状を復元し、平面領域に対してクリーンでよく構造化されたメッシュ接続を生成する。
また、支持平面上のオブジェクトの分離と柔軟な操作を可能にする構造化平面表現の応用についても検討する。
論文 参考訳(メタデータ) (2025-10-20T01:59:21Z) - Towards In-the-wild 3D Plane Reconstruction from a Single Image [16.857296782216206]
単一の画像から3D平面を再構築することは、3Dコンピュータビジョンにおいて重要な課題である。
これまでの最先端の手法は、屋内または屋外のドメインから1つのデータセットでシステムのトレーニングに重点を置いてきた。
ゼロショット3次元平面の検出と再構成を目的としたトランスフォーマーベースモデルであるZeroPlaneを紹介した。
論文 参考訳(メタデータ) (2025-06-03T06:14:05Z) - MonoPlane: Exploiting Monocular Geometric Cues for Generalizable 3D Plane Reconstruction [37.481945507799594]
本稿では,MonoPlaneという汎用的な3次元平面検出・再構成フレームワークを提案する。
まず、大規模な事前学習ニューラルネットワークを用いて、1つの画像から深度と表面の正常値を得る。
これらの特異な幾何学的手がかりを近接誘導RANSACフレームワークに組み込んで各平面インスタンスに順次適合させる。
論文 参考訳(メタデータ) (2024-11-02T12:15:29Z) - PlaneRecTR++: Unified Query Learning for Joint 3D Planar Reconstruction and Pose Estimation [12.200722074138298]
PlaneRecTR++は、多視点平面再構成とポーズ推定のすべてのタスクを統合するトランスフォーマーベースのアーキテクチャである。
提案した統合学習は,ScanNetv1, ScanNetv2, NYUv2-Plane, MatterPort3Dデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-25T18:28:19Z) - Lazy Visual Localization via Motion Averaging [89.8709956317671]
本研究では,データベースからシーンを再構築することなく,高精度なローカライゼーションを実現することができることを示す。
実験の結果、我々の視覚的ローカライゼーションの提案であるLazyLocは、最先端の構造に基づく手法に対して同等のパフォーマンスを実現していることがわかった。
論文 参考訳(メタデータ) (2023-07-19T13:40:45Z) - Occupancy Planes for Single-view RGB-D Human Reconstruction [120.5818162569105]
暗黙的な機能を持つシングルビューRGB-Dヒト再構成は、しばしばポイント単位の分類として定式化される。
本稿では,カメラの視野フラストラムをスライスする平面上での占有率予測として,一視点のRGB-D人間の再構成を定式化できる占有面(OPlanes)表現を提案する。
論文 参考訳(メタデータ) (2022-08-04T17:59:56Z) - PlaneTR: Structure-Guided Transformers for 3D Plane Recovery [56.23402171871664]
平面TRは1つの画像から同時に平面を検出し、再構成する。
PlaneTRはScanNetとNYUv2データセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-07-27T23:55:40Z) - Enabling Visual Action Planning for Object Manipulation through Latent
Space Roadmap [72.01609575400498]
高次元状態空間を有する複雑な操作タスクの視覚的行動計画のための枠組みを提案する。
低次元潜時空間におけるシステムダイナミクスを世界規模で捉えたグラフベースの構造であるタスク計画のためのLatent Space Roadmap(LSR)を提案する。
実ロボットで実行された2つの模擬ボックス積み重ねタスクと折り畳みタスクについて,本フレームワークの徹底的な検討を行う。
論文 参考訳(メタデータ) (2021-03-03T17:48:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。