論文の概要: Image-based Geolocalization by Ground-to-2.5D Map Matching
- arxiv url: http://arxiv.org/abs/2308.05993v2
- Date: Fri, 3 Nov 2023 14:41:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-06 17:30:52.256124
- Title: Image-based Geolocalization by Ground-to-2.5D Map Matching
- Title(参考訳): 地対2.5次元地図マッチングによる画像に基づく局所化
- Authors: Mengjie Zhou, Liu Liu, Yiran Zhong, Andrew Calway
- Abstract要約: 地上視のクエリ画像と2Dマップをマッチングするために、クロスビューのローカライゼーション技術を利用することが多い。
マルチモーダルデータから代表埋め込みを学習するための新しい手法を提案する。
本手法は,重要な幾何学的手がかりを符号化することにより,パノラマ画像と地図のマッチングのための識別的位置埋め込みを学習する。
- 参考スコア(独自算出の注目度): 21.21416396311102
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the image-based geolocalization problem, aiming to localize
ground-view query images on cartographic maps. Current methods often utilize
cross-view localization techniques to match ground-view query images with 2D
maps. However, the performance of these methods is unsatisfactory due to
significant cross-view appearance differences. In this paper, we lift
cross-view matching to a 2.5D space, where heights of structures (e.g., trees
and buildings) provide geometric information to guide the cross-view matching.
We propose a new approach to learning representative embeddings from
multi-modal data. Specifically, we establish a projection relationship between
2.5D space and 2D aerial-view space. The projection is further used to combine
multi-modal features from the 2.5D and 2D maps using an effective
pixel-to-point fusion method. By encoding crucial geometric cues, our method
learns discriminative location embeddings for matching panoramic images and
maps. Additionally, we construct the first large-scale ground-to-2.5D map
geolocalization dataset to validate our method and facilitate future research.
Both single-image based and route based localization experiments are conducted
to test our method. Extensive experiments demonstrate that the proposed method
achieves significantly higher localization accuracy and faster convergence than
previous 2D map-based approaches.
- Abstract(参考訳): 地図上でのグラウンドビュークエリー画像のローカライズを目的として,画像に基づくジオローカライズ問題について検討する。
現在の手法では、しばしば2次元マップと接地ビュークエリー画像のマッチングにクロスビューローカライズ手法を用いる。
しかし,これらの手法の性能は,外観の相違により不満足である。
本稿では,木や建物などの構造物の高さが幾何的情報を提供して,クロスビューマッチングを2.5次元空間に引き上げる手法を提案する。
マルチモーダルデータから代表埋め込みを学習するための新しい手法を提案する。
具体的には,2.5次元空間と2次元空中視点空間の投影関係を確立する。
このプロジェクションは、有効画素対点融合法を用いて2.5Dマップと2Dマップのマルチモーダル特徴を組み合わせるためにさらに使用される。
重要な幾何学的手がかりを符号化することにより,パノラマ画像と地図をマッチングするための識別的位置埋め込みを学習する。
さらに,本手法を検証し,今後の研究を促進するために,最初の大規模地対2.5dマップジオローカライズデータセットを構築した。
本手法をテストするため,シングルイメージとルートベースの両方のローカライゼーション実験を行った。
広範な実験により,提案手法は従来の2次元マップベースアプローチよりも精度が高く,収束速度が速いことがわかった。
関連論文リスト
- Multi-Scale Estimation for Omni-Directional Saliency Maps Using
Learnable Equator Bias [1.413861804135093]
サリエンシマップは、ヘッドマウントディスプレイで視線点の確率分布を表す。
そこで本研究では,全方位画像に対する新しいサリエンシマップ推定モデルを提案する。
提案手法により,サリエンシマップの精度を向上した。
論文 参考訳(メタデータ) (2023-09-15T04:08:20Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - A Local Iterative Approach for the Extraction of 2D Manifolds from
Strongly Curved and Folded Thin-Layer Structures [1.4272411349249625]
リッジ面は3次元(3D)データセットを多種多様なアプリケーションで解析する上で重要な特徴である。
ノイズデータから2次元多様体を抽出する新しい手法を開発した。
折り畳まれた銀板やパピルス板を含む実世界のデータだけでなく, 人工データにも本手法の適用性と堅牢性を実証した。
論文 参考訳(メタデータ) (2023-08-14T11:05:37Z) - LFM-3D: Learnable Feature Matching Across Wide Baselines Using 3D
Signals [9.201550006194994]
学習可能なマーカは、画像ペア間のコビジュアビリティの小さな領域だけが存在する場合、しばしば性能が低下する。
グラフニューラルネットワークに基づくモデルを用いた学習可能な特徴マッチングフレームワーク LFM-3D を提案する。
その結果,画像対の相対的ポーズ精度が向上し,画像対の相対的ポーズ精度が向上することがわかった。
論文 参考訳(メタデータ) (2023-03-22T17:46:27Z) - SketchSampler: Sketch-based 3D Reconstruction via View-dependent Depth
Sampling [75.957103837167]
1枚のスケッチ画像に基づいて3次元形状を再構成することは、スパースで不規則なスケッチと正規の高密度な3次元形状との間に大きな領域ギャップがあるため困難である。
既存の作品では、3D座標を直接予測するためにスケッチから抽出されたグローバルな特徴を活用しようとするが、通常は入力スケッチに忠実でない細部を失う。
論文 参考訳(メタデータ) (2022-08-14T16:37:51Z) - Satellite Image Based Cross-view Localization for Autonomous Vehicle [59.72040418584396]
本稿では,市販の高精細衛星画像を使用可能な地図として利用することにより,良好な精度でクロスビュー車両のローカライゼーションを実現することができることを示す。
本手法はKITTIとFord Multi-AVの季節データセットを地上ビューとして,Google Mapsを衛星ビューとして検証した。
論文 参考訳(メタデータ) (2022-07-27T13:16:39Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Learning Cross-Scale Visual Representations for Real-Time Image
Geo-Localization [21.375640354558044]
局所センサに基づく状態推定手法は、誤差が蓄積されるにつれて長距離ミッションがドリフトする傾向にある。
クロススケールなデータセットと、クロスモダリティソースから追加データを生成する手法を紹介する。
本稿では,監督なしに大規模視覚表現を学習するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-09T08:08:54Z) - Refer-it-in-RGBD: A Bottom-up Approach for 3D Visual Grounding in RGBD
Images [69.5662419067878]
RGBD画像における接地参照表現は新たな分野である。
本稿では,参照する物体が閉塞により部分的にスキャンされる場合が多い単視点rgbd画像における3次元視覚グランド化の新たな課題を提案する。
提案手法はまず,RGBD画像内の関連領域をローカライズするヒートマップを生成するために,下層の言語と視覚的特徴を融合させる。
次に、ヒートマップに基づく適応的特徴学習を行い、他のビジオ言語融合とオブジェクトレベルのマッチングを行い、最後に参照したオブジェクトを接地する。
論文 参考訳(メタデータ) (2021-03-14T11:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。