論文の概要: RHO: Robust Holistic OSM-Based Metric Cross-View Geo-Localization
- arxiv url: http://arxiv.org/abs/2603.27758v1
- Date: Sun, 29 Mar 2026 16:34:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.103468
- Title: RHO: Robust Holistic OSM-Based Metric Cross-View Geo-Localization
- Title(参考訳): RHO:ロバストでホロスティックなOSMベースのメトリビュージオローカライゼーション
- Authors: Junwei Zheng, Ruize Dai, Ruiping Liu, Zichao Zeng, Yufan Chen, Fangjinhua Wang, Kunyu Peng, Kailun Yang, Jiaming Zhang, Rainer Stiefelhagen,
- Abstract要約: Metric Cross-View Geo-Localization (MCVGL) は、地上画像と衛星画像のマッチングによって3DFカメラのポーズを推定することを目的としている。
総括的パノラマとOpenStreetMap(OSM)を用いたロバストMCVGLの研究を行った。
正確な視覚的ローカライゼーションのための2分岐ピンパンアーキテクチャを用いたRHOモデルを提案する。
- 参考スコア(独自算出の注目度): 46.34917046230067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Metric Cross-View Geo-Localization (MCVGL) aims to estimate the 3-DoF camera pose (position and heading) by matching ground and satellite images. In this work, instead of pinhole and satellite images, we study robust MCVGL using holistic panoramas and OpenStreetMap (OSM). To this end, we establish a large-scale MCVGL benchmark dataset, CV-RHO, with over 2.7M images under different weather and lighting conditions, as well as sensor noise. Furthermore, we propose a model termed RHO with a two-branch Pin-Pan architecture for accurate visual localization. A Split-Undistort-Merge (SUM) module is introduced to address the panoramic distortion, and a Position-Orientation Fusion (POF) mechanism is designed to enhance the localization accuracy. Extensive experiments prove the value of our CV-RHO dataset and the effectiveness of the RHO model, with a significant performance gain up to 20% compared with the state-of-the-art baselines. Project page: https://github.com/InSAI-Lab/RHO.
- Abstract(参考訳): Metric Cross-View Geo-Localization (MCVGL) は、地上画像と衛星画像のマッチングによって3DFカメラのポーズ(位置と方向)を推定することを目的としている。
本研究では、ピンホールや衛星画像の代わりに、全体論的パノラマとOpenStreetMap(OSM)を用いてロバストなMCVGLを研究する。
この目的のために,気象条件や照明条件の異なる270万以上の画像とセンサノイズを備えた大規模MCVGLベンチマークデータセットCV-RHOを構築した。
さらに,高精度な視覚的ローカライゼーションのための2分岐ピンパンアーキテクチャを用いたRHOモデルを提案する。
スプリット・アンディストルト・マージ(SUM)モジュールはパノラマ歪みに対処するために導入され、ポジション・オリエンテーション・フュージョン(POF)機構はローカライゼーションの精度を高めるために設計されている。
CV-RHOデータセットの価値とRHOモデルの有効性は,最先端のベースラインと比較して最大20%向上した。
プロジェクトページ:https://github.com/InSAI-Lab/RHO。
関連論文リスト
- MRGeo: Robust Cross-View Geo-Localization of Corrupted Images via Spatial and Channel Feature Enhancement [15.9788448312641]
クロスビュージオローカライゼーション (CVGL) は、対応するジオタグ付き衛星画像の検索により、ストリートビュー画像を正確にローカライズすることを目的としている。
以前の研究は、特定の標準データセット上でほぼ完璧なパフォーマンスを達成したが、現実の腐敗した環境での堅牢性は、まだ未調査のままである。
汚職下での堅牢なCVGLのための最初の体系的手法であるMRGeoを紹介する。
論文 参考訳(メタデータ) (2026-03-13T02:37:43Z) - MobileGeo: Exploring Hierarchical Knowledge Distillation for Resource-Efficient Cross-view Drone Geo-Localization [47.16612614191333]
クロスビューなジオローカライゼーションにより、航空画像とジオタグ付き衛星データベースとのマッチングによるドローンのローカライゼーションが可能になる。
MobileGeoは、デバイス上の効率的なCVGL用に設計されたモバイルフレンドリーなフレームワークである。
MobileGeoはNVIDIA AGX Orinエッジデバイス上で251.5FPSで動作する。
論文 参考訳(メタデータ) (2025-10-26T08:47:20Z) - GLEAM: Learning to Match and Explain in Cross-View Geo-Localization [66.11208984986813]
CVGL(Cross-View Geo-Localization)は、同じ地理的位置の異なる視点から撮影された画像間の対応を識別することに焦点を当てている。
GLEAM-Cは、UAV画像、ストリートマップ、パノラマ画像、地上写真を含む複数のビューとモダリティを衛星画像のみに合わせる基本CVGLモデルである。
従来のCVGL手法では解釈可能性の欠如に対処するため,クロスビュー対応予測と説明可能な推論を組み合わせたGLEAM-Xを提案する。
論文 参考訳(メタデータ) (2025-09-09T07:14:31Z) - OSMLoc: Single Image-Based Visual Localization in OpenStreetMap with Fused Geometric and Semantic Guidance [20.043977909592115]
OSMLocは、OpenStreetMapマップに対するファーストパーソナライズされたイメージに基づく、脳にインスパイアされた視覚的ローカライゼーションアプローチである。
意味的および幾何学的ガイダンスを統合し、精度、堅牢性、一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-11-13T14:59:00Z) - Unleashing Unlabeled Data: A Paradigm for Cross-View Geo-Localization [28.941724648519102]
本稿では,大規模クロスビュー・ジオローカライゼーション(CVGL)におけるラベルなしデータの有効利用について検討する。
CVGLの一般的なアプローチは、地上衛星画像ペアに依存し、ラベル駆動型教師付きトレーニングを採用する。
本稿では,初期擬似ラベルを検索するためのモデルを案内するクロスビュープロジェクションを含む教師なしフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-21T07:48:35Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - OmniSLAM: Omnidirectional Localization and Dense Mapping for
Wide-baseline Multi-camera Systems [88.41004332322788]
超広視野魚眼カメラ(FOV)を用いた広視野多視点ステレオ構成のための全方向位置決めと高密度マッピングシステムを提案する。
より実用的で正確な再構築のために、全方向深度推定のための改良された軽量のディープニューラルネットワークを導入する。
我々は全方位深度推定をビジュアル・オドメトリー(VO)に統合し,大域的整合性のためのループ閉鎖モジュールを付加する。
論文 参考訳(メタデータ) (2020-03-18T05:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。