論文の概要: A Unified Hierarchical Framework for Fine-grained Cross-view Geo-localization over Large-scale Scenarios
- arxiv url: http://arxiv.org/abs/2505.07622v1
- Date: Mon, 12 May 2025 14:44:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.440418
- Title: A Unified Hierarchical Framework for Fine-grained Cross-view Geo-localization over Large-scale Scenarios
- Title(参考訳): 大規模シナリオ上での微粒なクロスビュージオローカライゼーションのための統一階層型フレームワーク
- Authors: Zhuo Song, Ye Zhang, Kunhong Li, Longguang Wang, Yulan Guo,
- Abstract要約: クロスビューなジオローカライゼーションは大規模ローカライゼーション問題に対する有望な解決策である。
本稿では,新しい階層的ジオローカライゼーションフレームワークUnifyGeoを提案する。
タスク分離設定とタスク関連設定の両方において、UnifyGeoは最先端の処理性能を大きく上回ることを示す。
- 参考スコア(独自算出の注目度): 43.8734658237949
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-view geo-localization is a promising solution for large-scale localization problems, requiring the sequential execution of retrieval and metric localization tasks to achieve fine-grained predictions. However, existing methods typically focus on designing standalone models for these two tasks, resulting in inefficient collaboration and increased training overhead. In this paper, we propose UnifyGeo, a novel unified hierarchical geo-localization framework that integrates retrieval and metric localization tasks into a single network. Specifically, we first employ a unified learning strategy with shared parameters to jointly learn multi-granularity representation, facilitating mutual reinforcement between these two tasks. Subsequently, we design a re-ranking mechanism guided by a dedicated loss function, which enhances geo-localization performance by improving both retrieval accuracy and metric localization references. Extensive experiments demonstrate that UnifyGeo significantly outperforms the state-of-the-arts in both task-isolated and task-associated settings. Remarkably, on the challenging VIGOR benchmark, which supports fine-grained localization evaluation, the 1-meter-level localization recall rate improves from 1.53\% to 39.64\% and from 0.43\% to 25.58\% under same-area and cross-area evaluations, respectively. Code will be made publicly available.
- Abstract(参考訳): クロスビューなジオローカライゼーションは大規模なローカライゼーション問題に対して有望な解決策であり、詳細な予測を行うためには、検索およびメートル法ローカライゼーションタスクのシーケンシャルな実行が必要である。
しかし、既存の手法は一般的にこれらの2つのタスクのためのスタンドアロンモデルの設計に重点を置いており、非効率なコラボレーションとトレーニングのオーバーヘッドの増加をもたらす。
本稿では,検索タスクとメトリックローカライズタスクをひとつのネットワークに統合する,新しい階層的ジオローカライズフレームワークUnifyGeoを提案する。
具体的には、まず共有パラメータを持つ統一学習戦略を用いて、多粒度表現を共同学習し、これらの2つのタスク間の相互強化を促進する。
その後、検索精度とメートル法ローカライゼーション基準の両方を改善し、ジオローカライゼーション性能を向上させる専用損失関数で導かれるリグレード機構を設計する。
大規模な実験により、UnifyGeoはタスクアイソレーションとタスク関連設定の両方で最先端を著しく上回っていることが示されている。
注目すべきは、微粒なローカライゼーション評価をサポートする挑戦的なVIGORベンチマークにおいて、1mレベルのローカライゼーションリコール率は、それぞれ1.53\%から39.64\%に改善され、同じ領域とクロスエリアの評価では0.43\%から25.58\%に改善されていることである。
コードは公開されます。
関連論文リスト
- VLM-Guided Visual Place Recognition for Planet-Scale Geo-Localization [24.433604332415204]
本稿では,視覚言語モデルと視覚的位置認識の強みを融合した,新しいハイブリッドなジオローカライゼーションフレームワークを提案する。
我々は,複数のジオローカライゼーションベンチマークに対するアプローチを評価し,従来手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2025-07-23T12:23:03Z) - Dynamic Contrastive Learning for Hierarchical Retrieval: A Case Study of Distance-Aware Cross-View Geo-Localization [20.868592923432843]
既存のディープラーニングを用いたクロスビュージオローカライズ手法は主に、クロスドメイン画像マッチングの精度向上に重点を置いている。
特徴表現を階層的空間的マージンに応じて段階的に整列させる新しいフレームワークである動的コントラスト学習(DyCL)を提案する。
論文 参考訳(メタデータ) (2025-06-29T03:57:01Z) - EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。
また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。
CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文 参考訳(メタデータ) (2025-04-28T02:41:12Z) - Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - CurriculumLoc: Enhancing Cross-Domain Geolocalization through
Multi-Stage Refinement [11.108860387261508]
ビジュアルジオローカライゼーションはコスト効率が高くスケーラブルなタスクであり、未知の場所で撮影された1つ以上のクエリイメージとジオタグ付き参照イメージのセットをマッチングする。
我々は,グローバルな意味認識と局所的幾何学的検証を備えたキーポイント検出と記述法であるCurriculumLocを開発した。
我々は、ALTOで62.6%と94.5%の新しいハイリコール@1スコアをそれぞれ2つの異なる距離で達成した。
論文 参考訳(メタデータ) (2023-11-20T08:40:01Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - Cross-view Geo-localization via Learning Disentangled Geometric Layout
Correspondence [11.823147814005411]
クロスビュージオローカライゼーションは、参照ジオタグ付き空中画像データベースとマッチングすることで、クエリーグラウンド画像の位置を推定することを目的としている。
最近の研究は、クロスビューなジオローカライゼーションベンチマークにおいて顕著な進歩を遂げている。
しかし、既存の手法は依然としてクロスエリアベンチマークのパフォーマンスの低下に悩まされている。
論文 参考訳(メタデータ) (2022-12-08T04:54:01Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。