論文の概要: Revisiting Street-to-Aerial View Image Geo-localization and Orientation
Estimation
- arxiv url: http://arxiv.org/abs/2005.11592v2
- Date: Mon, 7 Dec 2020 02:15:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 03:45:56.304881
- Title: Revisiting Street-to-Aerial View Image Geo-localization and Orientation
Estimation
- Title(参考訳): 街路対aerial view像のジオロカライズと方向推定の再検討
- Authors: Sijie Zhu and Taojiannan Yang and Chen Chen
- Abstract要約: 単純なシームズネットワークの性能はアライメント設定に大きく依存していることを示す。
本稿では,一対のクロスビュー画像と未知のアライメント情報との配向/配向を推定する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 19.239311087570318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Street-to-aerial image geo-localization, which matches a query street-view
image to the GPS-tagged aerial images in a reference set, has attracted
increasing attention recently. In this paper, we revisit this problem and point
out the ignored issue about image alignment information. We show that the
performance of a simple Siamese network is highly dependent on the alignment
setting and the comparison of previous works can be unfair if they have
different assumptions. Instead of focusing on the feature extraction under the
alignment assumption, we show that improvements in metric learning techniques
significantly boost the performance regardless of the alignment. Without
leveraging the alignment information, our pipeline outperforms previous works
on both panorama and cropped datasets. Furthermore, we conduct visualization to
help understand the learned model and the effect of alignment information using
Grad-CAM. With our discovery on the approximate rotation-invariant activation
maps, we propose a novel method to estimate the orientation/alignment between a
pair of cross-view images with unknown alignment information. It achieves
state-of-the-art results on the CVUSA dataset.
- Abstract(参考訳): 近年,クエリストリートビュー画像とGPSタグ付き空中画像とを基準セットでマッチングするストリート・ツー・エアリアル画像のジオローカライゼーションが注目されている。
本稿では,この問題を再検討し,画像アライメント情報に関する無視された問題点を指摘する。
その結果,単純なシャムネットワークの性能はアライメント設定に大きく依存しており,異なる仮定を持つ場合,先行作品の比較は不公平であることがわかった。
アライメント仮定の下で特徴抽出に焦点を当てる代わりに、メトリック学習技術の改善がアライメントによらず、パフォーマンスを著しく向上させることを示した。
アライメント情報を活用することなく、パイプラインは、パノラマとクロッピングデータセットの両方の以前の作業よりも優れています。
さらに,学習モデルとGrad-CAMを用いたアライメント情報の効果を理解するために可視化を行う。
近似回転不変のアクティベーションマップの発見により、一対のクロスビュー画像と未知のアライメント情報との配向/配向を推定する新しい手法を提案する。
CVUSAデータセットで最先端の結果を達成する。
関連論文リスト
- AddressCLIP: Empowering Vision-Language Models for City-wide Image Address Localization [57.34659640776723]
そこで我々は,より意味論的に問題を解決するために,AddressCLIPというエンドツーエンドのフレームワークを提案する。
われわれはピッツバーグとサンフランシスコに3つのデータセットを構築した。
論文 参考訳(メタデータ) (2024-07-11T03:18:53Z) - Style Alignment based Dynamic Observation Method for UAV-View Geo-localization [7.185123213523453]
UAVビューのジオローカライゼーションのためのスタイルアライメントに基づく動的観察法を提案する。
具体的には、ドローンビュー画像の多様な視覚スタイルから衛星画像の統一的な視覚スタイルへ変換するスタイルアライメント戦略を導入する。
動的観察モジュールは、人間の観察習慣を模倣して画像の空間分布を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-03T06:19:42Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Sample4Geo: Hard Negative Sampling For Cross-View Geo-Localisation [2.3020018305241337]
対称なInfoNCE損失を伴うコントラスト学習に基づく,シンプルだが効果的なアーキテクチャを提案する。
私たちのフレームワークは、アグリゲーションモジュールの使用を不要にする、狭いトレーニングパイプラインで構成されています。
本研究は,CVUSA,CVACT,University-1652,VIGORなどの一般的なクロスビューデータセットに対して,優れた性能を示す。
論文 参考訳(メタデータ) (2023-03-21T13:49:49Z) - Cross-View Image Sequence Geo-localization [6.555961698070275]
クロスビュージオローカライゼーションは,クエリ基底画像のGPS位置を推定することを目的としている。
最近のアプローチでは、パノラマ画像を用いて視界範囲を拡大している。
本研究では、フィールド-オフ-ビューの限られた画像のシーケンスで動作する、最初のクロスビューなジオローカライズ手法を提案する。
論文 参考訳(メタデータ) (2022-10-25T19:46:18Z) - Multi-view Drone-based Geo-localization via Style and Spatial Alignment [47.95626612936813]
マルチビュー・マルチソース・ジオローカライゼーションは、ドローンビュー画像と衛星ビュー画像とを事前アノテーション付きGPSタグとマッチングすることにより、GPS位置決めの重要な補助的手法として機能する。
パターンを整列させるエレガントな配向に基づく手法を提案し、整列部分特徴を抽出する新しい分岐を導入する。
論文 参考訳(メタデータ) (2020-06-23T15:44:02Z) - Where am I looking at? Joint Location and Orientation Estimation by
Cross-View Matching [95.64702426906466]
ジオタグ付き空中画像の大規模データベースを考えると、クロスビューなジオローカライゼーションは問題となる。
地上画像と空中画像の向きを知ることは、これらの2つのビュー間のあいまいさを著しく軽減することができる。
局所化時の横方向のアライメントを推定する動的類似マッチングネットワークを設計する。
論文 参考訳(メタデータ) (2020-05-08T05:21:16Z) - RANSAC-Flow: generic two-stage image alignment [53.11926395028508]
単純な教師なしのアプローチは、様々なタスクにおいて驚くほどうまく機能することを示す。
その単純さにもかかわらず、我々の手法は様々なタスクやデータセットで競合する結果を示す。
論文 参考訳(メタデータ) (2020-04-03T12:37:58Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。