論文の概要: Image-based Geolocalization by Ground-to-2.5D Map Matching
- arxiv url: http://arxiv.org/abs/2308.05993v1
- Date: Fri, 11 Aug 2023 08:00:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 14:45:00.576322
- Title: Image-based Geolocalization by Ground-to-2.5D Map Matching
- Title(参考訳): 地対2.5次元地図マッチングによる画像に基づく局所化
- Authors: Mengjie Zhou, Liu Liu, Yiran Zhong
- Abstract要約: マルチモデルデータから代表埋め込みを学習するための新しいアプローチを提案する。
まず2次元地図を地平面パノラマ画像と極変換で整列し,パノラマ画像と地図とのギャップを小さくする。
次に,グローバル融合を利用して2次元と2.5次元の地図からマルチモーダルな特徴を融合させ,位置埋め込みの特異性を高める。
- 参考スコア(独自算出の注目度): 23.534106469593606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the image-based geolocalization problem that aims to locate
ground-view query images on cartographic maps. Previous methods often utilize
cross-view localization techniques to match ground-view query images with 2D
maps. However, the performance of these methods is frequently unsatisfactory
due to the significant cross-view appearance differences. In this paper, we
extend cross-view matching to 2.5D spaces, where the heights of the structures
- such as trees, buildings, and other objects - can provide additional
information to guide the cross-view matching. We present a new approach to
learning representative embeddings from multi-model data. Specifically, we
first align 2D maps to ground-view panoramic images with polar transform to
reduce the gap between panoramic images and maps. Then we leverage global
fusion to fuse the multi-modal features from 2D and 2.5D maps to increase the
distinctiveness of location embeddings. We construct the first large-scale
ground-to-2.5D map geolocalization dataset to validate our method and
facilitate the research. We test our learned embeddings on two popular
localization approaches, i.e., single-image based localization, and route based
localization. Extensive experiments demonstrate that our proposed method
achieves significantly higher localization accuracy and faster convergence than
previous 2D map-based approaches.
- Abstract(参考訳): 地図上での地上視クエリー画像の探索を目的とした画像に基づく位置情報化問題について検討する。
従来の手法では、2dマップと地上からの問合せ画像をマッチングするために、クロスビューのローカライズ技術を使うことが多い。
しかし,これらの手法の性能は,外観の相違が著しいため,しばしば不満足である。
本稿では,木,建物,その他のオブジェクトなどの構造物の高さが,クロスビューマッチングのガイドとなる追加情報を提供することができる2.5次元空間に,クロスビューマッチングを拡張した。
マルチモデルデータから代表埋め込みを学習するための新しいアプローチを提案する。
具体的には,まず2次元地図と地平面パノラマ画像とを極変換することで,パノラマ画像と地図とのギャップを小さくする。
次に,グローバル融合を利用して2次元と2.5次元の地図からマルチモーダルな特徴を融合させ,位置埋め込みの特異性を高める。
本手法を検証し,研究を容易にするために,最初の大規模地対2.5dマップジオローカライズデータセットを構築した。
学習した埋め込みを2つの一般的なローカライズアプローチ、すなわち単一画像ベースのローカライズと経路ベースのローカライズでテストする。
提案手法は,従来の2次元地図を用いた手法よりも精度が高く,収束速度も速いことを示す。
関連論文リスト
- Multi-Scale Estimation for Omni-Directional Saliency Maps Using
Learnable Equator Bias [1.413861804135093]
サリエンシマップは、ヘッドマウントディスプレイで視線点の確率分布を表す。
そこで本研究では,全方位画像に対する新しいサリエンシマップ推定モデルを提案する。
提案手法により,サリエンシマップの精度を向上した。
論文 参考訳(メタデータ) (2023-09-15T04:08:20Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - A Local Iterative Approach for the Extraction of 2D Manifolds from
Strongly Curved and Folded Thin-Layer Structures [1.4272411349249625]
リッジ面は3次元(3D)データセットを多種多様なアプリケーションで解析する上で重要な特徴である。
ノイズデータから2次元多様体を抽出する新しい手法を開発した。
折り畳まれた銀板やパピルス板を含む実世界のデータだけでなく, 人工データにも本手法の適用性と堅牢性を実証した。
論文 参考訳(メタデータ) (2023-08-14T11:05:37Z) - LFM-3D: Learnable Feature Matching Across Wide Baselines Using 3D
Signals [9.201550006194994]
学習可能なマーカは、画像ペア間のコビジュアビリティの小さな領域だけが存在する場合、しばしば性能が低下する。
グラフニューラルネットワークに基づくモデルを用いた学習可能な特徴マッチングフレームワーク LFM-3D を提案する。
その結果,画像対の相対的ポーズ精度が向上し,画像対の相対的ポーズ精度が向上することがわかった。
論文 参考訳(メタデータ) (2023-03-22T17:46:27Z) - SketchSampler: Sketch-based 3D Reconstruction via View-dependent Depth
Sampling [75.957103837167]
1枚のスケッチ画像に基づいて3次元形状を再構成することは、スパースで不規則なスケッチと正規の高密度な3次元形状との間に大きな領域ギャップがあるため困難である。
既存の作品では、3D座標を直接予測するためにスケッチから抽出されたグローバルな特徴を活用しようとするが、通常は入力スケッチに忠実でない細部を失う。
論文 参考訳(メタデータ) (2022-08-14T16:37:51Z) - Satellite Image Based Cross-view Localization for Autonomous Vehicle [59.72040418584396]
本稿では,市販の高精細衛星画像を使用可能な地図として利用することにより,良好な精度でクロスビュー車両のローカライゼーションを実現することができることを示す。
本手法はKITTIとFord Multi-AVの季節データセットを地上ビューとして,Google Mapsを衛星ビューとして検証した。
論文 参考訳(メタデータ) (2022-07-27T13:16:39Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Learning Cross-Scale Visual Representations for Real-Time Image
Geo-Localization [21.375640354558044]
局所センサに基づく状態推定手法は、誤差が蓄積されるにつれて長距離ミッションがドリフトする傾向にある。
クロススケールなデータセットと、クロスモダリティソースから追加データを生成する手法を紹介する。
本稿では,監督なしに大規模視覚表現を学習するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-09T08:08:54Z) - Refer-it-in-RGBD: A Bottom-up Approach for 3D Visual Grounding in RGBD
Images [69.5662419067878]
RGBD画像における接地参照表現は新たな分野である。
本稿では,参照する物体が閉塞により部分的にスキャンされる場合が多い単視点rgbd画像における3次元視覚グランド化の新たな課題を提案する。
提案手法はまず,RGBD画像内の関連領域をローカライズするヒートマップを生成するために,下層の言語と視覚的特徴を融合させる。
次に、ヒートマップに基づく適応的特徴学習を行い、他のビジオ言語融合とオブジェクトレベルのマッチングを行い、最後に参照したオブジェクトを接地する。
論文 参考訳(メタデータ) (2021-03-14T11:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。