論文の概要: Cross-View Image Sequence Geo-localization
- arxiv url: http://arxiv.org/abs/2210.14295v1
- Date: Tue, 25 Oct 2022 19:46:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 14:52:25.187005
- Title: Cross-View Image Sequence Geo-localization
- Title(参考訳): クロスビュー画像シーケンスジオローカライズ
- Authors: Xiaohan Zhang, Waqas Sultani, Safwan Wshah
- Abstract要約: クロスビュージオローカライゼーションは,クエリ基底画像のGPS位置を推定することを目的としている。
最近のアプローチでは、パノラマ画像を用いて視界範囲を拡大している。
本研究では、フィールド-オフ-ビューの限られた画像のシーケンスで動作する、最初のクロスビューなジオローカライズ手法を提案する。
- 参考スコア(独自算出の注目度): 6.555961698070275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-view geo-localization aims to estimate the GPS location of a query
ground-view image by matching it to images from a reference database of
geo-tagged aerial images. To address this challenging problem, recent
approaches use panoramic ground-view images to increase the range of
visibility. Although appealing, panoramic images are not readily available
compared to the videos of limited Field-Of-View (FOV) images. In this paper, we
present the first cross-view geo-localization method that works on a sequence
of limited FOV images. Our model is trained end-to-end to capture the temporal
structure that lies within the frames using the attention-based temporal
feature aggregation module. To robustly tackle different sequences length and
GPS noises during inference, we propose to use a sequential dropout scheme to
simulate variant length sequences. To evaluate the proposed approach in
realistic settings, we present a new large-scale dataset containing ground-view
sequences along with the corresponding aerial-view images. Extensive
experiments and comparisons demonstrate the superiority of the proposed
approach compared to several competitive baselines.
- Abstract(参考訳): クロスビュージオローカライゼーションは、ジオタグ付き空中画像の参照データベースからの画像と照合することで、クエリ基底画像のGPS位置を推定することを目的としている。
この課題に対処するため、最近のアプローチではパノラマ画像を用いて視界範囲を拡大している。
魅力的ではあるが、フィールドオフビュー(FOV)の限られた画像と比較してパノラマ画像は容易には利用できない。
本稿では,限定されたFOV画像のシーケンスで動作する,最初のクロスビューなジオローカライズ手法を提案する。
我々のモデルは、注目に基づく時間的特徴集約モジュールを用いて、フレーム内にある時間的構造を捉えるために、エンドツーエンドで訓練されている。
推論中に異なるシーケンス長とGPSノイズに頑健に対処するために,可変長列をシミュレートする逐次ドロップアウト方式を提案する。
提案手法を現実的な設定で評価するために,地上画像と対応する空中画像を含む大規模データセットを提案する。
広範な実験と比較は、いくつかの競合ベースラインと比較して提案手法が優れていることを示している。
関連論文リスト
- Tightly-Coupled, Speed-aided Monocular Visual-Inertial Localization in Topological Map [0.7373617024876725]
本稿では,トポロジカルマップを用いた車両速度支援単眼視覚慣性位置推定のための新しいアルゴリズムを提案する。
提案システムは、GPSやLiDARのような高価なセンサーに大きく依存する既存の手法の限界に対処することを目的としている。
論文 参考訳(メタデータ) (2024-11-08T11:55:27Z) - Style Alignment based Dynamic Observation Method for UAV-View Geo-localization [7.185123213523453]
UAVビューのジオローカライゼーションのためのスタイルアライメントに基づく動的観察法を提案する。
具体的には、ドローンビュー画像の多様な視覚スタイルから衛星画像の統一的な視覚スタイルへ変換するスタイルアライメント戦略を導入する。
動的観察モジュールは、人間の観察習慣を模倣して画像の空間分布を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-03T06:19:42Z) - Cross-View Visual Geo-Localization for Outdoor Augmented Reality [11.214903134756888]
地上画像のクロスビューマッチングによる測地位置推定の課題をジオレファレンス衛星画像データベースに解決する。
本稿では,新しいトランスフォーマーニューラルネットワークモデルを提案する。
いくつかのベンチマーク・クロスビュー・ジオローカライズ・データセットの実験により、我々のモデルが最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2023-03-28T01:58:03Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - CVLNet: Cross-View Semantic Correspondence Learning for Video-based
Camera Localization [89.69214577915959]
本稿では,クロスビューカメラのローカライゼーション問題に対処する。
本稿では、類似性マッチングの前に、問合せカメラの衛星画像に対する相対変位を推定する。
実験は、単一の画像に基づく位置決めよりもビデオベースの位置決めの有効性を実証した。
論文 参考訳(メタデータ) (2022-08-07T07:35:17Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Multi-view Drone-based Geo-localization via Style and Spatial Alignment [47.95626612936813]
マルチビュー・マルチソース・ジオローカライゼーションは、ドローンビュー画像と衛星ビュー画像とを事前アノテーション付きGPSタグとマッチングすることにより、GPS位置決めの重要な補助的手法として機能する。
パターンを整列させるエレガントな配向に基づく手法を提案し、整列部分特徴を抽出する新しい分岐を導入する。
論文 参考訳(メタデータ) (2020-06-23T15:44:02Z) - Where am I looking at? Joint Location and Orientation Estimation by
Cross-View Matching [95.64702426906466]
ジオタグ付き空中画像の大規模データベースを考えると、クロスビューなジオローカライゼーションは問題となる。
地上画像と空中画像の向きを知ることは、これらの2つのビュー間のあいまいさを著しく軽減することができる。
局所化時の横方向のアライメントを推定する動的類似マッチングネットワークを設計する。
論文 参考訳(メタデータ) (2020-05-08T05:21:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。