論文の概要: PALMS+: Modular Image-Based Floor Plan Localization Leveraging Depth Foundation Model
- arxiv url: http://arxiv.org/abs/2511.09724v1
- Date: Fri, 14 Nov 2025 01:06:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.440643
- Title: PALMS+: Modular Image-Based Floor Plan Localization Leveraging Depth Foundation Model
- Title(参考訳): PALMS+:depth Foundationモデルを活用したモジュールイメージベースのフロアプランローカライゼーション
- Authors: Yunqian Cheng, Benjamin Princen, Roberto Manduchi,
- Abstract要約: PALMSのような視覚ベースの手法は、フロアプランと静止スキャンのみを使用してインフラストラクチャフリーのローカライズを可能にする。
提案するPALMS$+$は,RGB画像からスケールアライメントされた3次元点雲を再構成することにより,これらの課題に対処するモジュール型画像ベースシステムである。
PalmS$+$は、直接またはシーケンシャルなローカライゼーションに使用できる位置と向きの後方を出力する。
- 参考スコア(独自算出の注目度): 6.965992036664047
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Indoor localization in GPS-denied environments is crucial for applications like emergency response and assistive navigation. Vision-based methods such as PALMS enable infrastructure-free localization using only a floor plan and a stationary scan, but are limited by the short range of smartphone LiDAR and ambiguity in indoor layouts. We propose PALMS$+$, a modular, image-based system that addresses these challenges by reconstructing scale-aligned 3D point clouds from posed RGB images using a foundation monocular depth estimation model (Depth Pro), followed by geometric layout matching via convolution with the floor plan. PALMS$+$ outputs a posterior over the location and orientation, usable for direct or sequential localization. Evaluated on the Structured3D and a custom campus dataset consisting of 80 observations across four large campus buildings, PALMS$+$ outperforms PALMS and F3Loc in stationary localization accuracy -- without requiring any training. Furthermore, when integrated with a particle filter for sequential localization on 33 real-world trajectories, PALMS$+$ achieved lower localization errors compared to other methods, demonstrating robustness for camera-free tracking and its potential for infrastructure-free applications. Code and data are available at https://github.com/Head-inthe-Cloud/PALMS-Plane-based-Accessible-Indoor-Localization-Using-Mobile-Sm artphones
- Abstract(参考訳): 緊急応答や補助ナビゲーションといったアプリケーションには,GPSを用いた環境における屋内のローカライゼーションが不可欠である。
PALMSのようなビジョンベースの手法は、フロアプランと静止スキャンのみを用いたインフラストラクチャフリーなローカライゼーションを可能にするが、スマートフォンのLiDARと屋内レイアウトのあいまいさによって制限されている。
PALMS$+$は、基礎的な単眼深度推定モデル(Depth Pro)を用いて、提案したRGB画像からスケールアライメントされた3次元点雲を再構成し、フロアプランとの畳み込みによる幾何学的レイアウトマッチングを行うことにより、これらの課題に対処するモジュール型画像ベースシステムである。
PALMS$+$は、直接またはシーケンシャルなローカライゼーションに使用可能な、位置と向きの後方を出力する。
Structured3Dと、大規模な4つのキャンパスビルで80の観測結果からなるカスタムキャンパスデータセットに基づいて評価された。
さらに、33個の実世界の軌道上での逐次ローカライズのための粒子フィルタと統合した場合、PALMS$+$は他の手法と比較して低いローカライズ誤差を達成し、カメラレストラッキングとインフラストラクチャフリーアプリケーションの可能性を示す。
コードとデータはhttps://github.com/Head-in the-Cloud/PALMS-Plane-based-Accessible-Indoor-Localization-Using-Mobile-Smartphonesで公開されている。
関連論文リスト
- Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.57282092735991]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。
地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。
実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文 参考訳(メタデータ) (2025-09-11T18:52:16Z) - Vision-Based Localization and LLM-based Navigation for Indoor Environments [4.58063394223487]
本研究では,大規模言語モデル(LLM)に基づくナビゲーションと視覚的ローカライゼーションを統合した屋内ローカライゼーションとナビゲーション手法を提案する。
このモデルは、制限された視聴条件下であっても、テストされた全てのウェイポイントに対して高い信頼性と96%の精度を実現した。
本研究は、オフザシェルフカメラと一般公開フロアプランを用いた、スケーラブルでインフラストラクチャフリーな屋内ナビゲーションの可能性を示す。
論文 参考訳(メタデータ) (2025-08-11T15:59:09Z) - GeoDistill: Geometry-Guided Self-Distillation for Weakly Supervised Cross-View Localization [70.65458151146767]
クロスビューのローカライゼーションは、自律ナビゲーションや拡張現実のような大規模な屋外アプリケーションにとって不可欠である。
既存の手法は、しばしば完全に教師付き学習に依存している。
本研究では,FoV(Field-of-View)ベースのマスキングを用いた教師学習フレームワークGeoDistillを提案する。
論文 参考訳(メタデータ) (2025-07-15T03:00:15Z) - SF-Loc: A Visual Mapping and Geo-Localization System based on Sparse Visual Structure Frames [3.5047603107971397]
SF-Locは軽量なビジュアルマッピングとマップ支援型ローカライゼーションシステムである。
マッピングフェーズでは,多センサ高密度バンドル調整(MS-DBA)を適用し,ジオレファレンスな視覚構造フレームを構築する。
ローカライズフェーズでは、多フレーム情報と地図分布を完全に統合した粗大な視覚に基づくローカライズを行う。
論文 参考訳(メタデータ) (2024-12-02T13:51:58Z) - PALMS: Plane-based Accessible Indoor Localization Using Mobile Smartphones [5.467790613949593]
PALMSはモバイルスマートフォンにおける革新的なグローバルローカライゼーションと再ローカライゼーションシステムである。
本システムでは,1つの瞬時観測と計測データを考慮した動的局所化方式を採用している。
論文 参考訳(メタデータ) (2024-10-21T07:05:07Z) - Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation [64.84996994779443]
本稿では,連続視覚言語ナビゲーション(VLN)タスクのためのAffordances-Oriented Plannerを提案する。
我々のAO-Plannerは、様々な基礎モデルを統合して、アベイランス指向の低レベルな動き計画とハイレベルな意思決定を実現する。
挑戦的なR2R-CEデータセットとRxR-CEデータセットの実験は、AO-Plannerが最先端のゼロショットのパフォーマンスを達成したことを示している。
論文 参考訳(メタデータ) (2024-07-08T12:52:46Z) - Improving Gaussian Splatting with Localized Points Management [52.009874685460694]
局所的点管理(LPM)は、点加算と幾何校正の両方を最大限に必要としながら、これらの誤り貢献ゾーンを特定することができる。
LPMは特定されたゾーンに点密度を適用し、これらの領域の前にある点の不透明度をリセットし、不適切な点を修正する新しい機会を生み出す。
特に、LPMは静的3DGSとダイナミックなSpaceTimeGSの両方を改善して、リアルタイム速度を維持しながら最先端のレンダリング品質を実現している。
論文 参考訳(メタデータ) (2024-06-06T16:55:07Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D
Images [58.720142291102135]
本稿では,屋内環境における視覚的位置認識能力の探索を目的とした,HPointLocという新しいデータセットを提案する。
データセットは人気のあるHabitatシミュレータに基づいており、独自のセンサーデータとオープンデータセットの両方を使用して屋内シーンを生成することができる。
論文 参考訳(メタデータ) (2022-12-30T12:20:56Z) - Distinctive 3D local deep descriptors [2.512827436728378]
ポイントクラウドパッチは抽出され、推定されたローカル参照フレームに対して正準化され、PointNetベースのディープニューラルネットワークによって符号化される。
我々は、異なるセンサを用いて再構成された点雲からなる複数のデータセットにおいて、DIPを、別の手作り、ディープディスクリプタと比較し、比較した。
論文 参考訳(メタデータ) (2020-09-01T06:25:06Z) - Feasibility of Video-based Sub-meter Localization on
Resource-constrained Platforms [0.228438857884398]
資源制約のあるプラットフォーム上でのリアルタイムなビデオベースのローカライゼーションの実現可能性について検討する。
スマートフォン型プラットフォームでは,サブメーターの精度が,リアルタイムに達成可能であることを示す。
論文 参考訳(メタデータ) (2020-02-19T07:35:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。