論文の概要: A Unified Hierarchical Framework for Fine-grained Cross-view Geo-localization over Large-scale Scenarios
- arxiv url: http://arxiv.org/abs/2505.07622v1
- Date: Mon, 12 May 2025 14:44:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.440418
- Title: A Unified Hierarchical Framework for Fine-grained Cross-view Geo-localization over Large-scale Scenarios
- Title(参考訳): 大規模シナリオ上での微粒なクロスビュージオローカライゼーションのための統一階層型フレームワーク
- Authors: Zhuo Song, Ye Zhang, Kunhong Li, Longguang Wang, Yulan Guo,
- Abstract要約: クロスビューなジオローカライゼーションは大規模ローカライゼーション問題に対する有望な解決策である。
本稿では,新しい階層的ジオローカライゼーションフレームワークUnifyGeoを提案する。
タスク分離設定とタスク関連設定の両方において、UnifyGeoは最先端の処理性能を大きく上回ることを示す。
- 参考スコア(独自算出の注目度): 43.8734658237949
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-view geo-localization is a promising solution for large-scale localization problems, requiring the sequential execution of retrieval and metric localization tasks to achieve fine-grained predictions. However, existing methods typically focus on designing standalone models for these two tasks, resulting in inefficient collaboration and increased training overhead. In this paper, we propose UnifyGeo, a novel unified hierarchical geo-localization framework that integrates retrieval and metric localization tasks into a single network. Specifically, we first employ a unified learning strategy with shared parameters to jointly learn multi-granularity representation, facilitating mutual reinforcement between these two tasks. Subsequently, we design a re-ranking mechanism guided by a dedicated loss function, which enhances geo-localization performance by improving both retrieval accuracy and metric localization references. Extensive experiments demonstrate that UnifyGeo significantly outperforms the state-of-the-arts in both task-isolated and task-associated settings. Remarkably, on the challenging VIGOR benchmark, which supports fine-grained localization evaluation, the 1-meter-level localization recall rate improves from 1.53\% to 39.64\% and from 0.43\% to 25.58\% under same-area and cross-area evaluations, respectively. Code will be made publicly available.
- Abstract(参考訳): クロスビューなジオローカライゼーションは大規模なローカライゼーション問題に対して有望な解決策であり、詳細な予測を行うためには、検索およびメートル法ローカライゼーションタスクのシーケンシャルな実行が必要である。
しかし、既存の手法は一般的にこれらの2つのタスクのためのスタンドアロンモデルの設計に重点を置いており、非効率なコラボレーションとトレーニングのオーバーヘッドの増加をもたらす。
本稿では,検索タスクとメトリックローカライズタスクをひとつのネットワークに統合する,新しい階層的ジオローカライズフレームワークUnifyGeoを提案する。
具体的には、まず共有パラメータを持つ統一学習戦略を用いて、多粒度表現を共同学習し、これらの2つのタスク間の相互強化を促進する。
その後、検索精度とメートル法ローカライゼーション基準の両方を改善し、ジオローカライゼーション性能を向上させる専用損失関数で導かれるリグレード機構を設計する。
大規模な実験により、UnifyGeoはタスクアイソレーションとタスク関連設定の両方で最先端を著しく上回っていることが示されている。
注目すべきは、微粒なローカライゼーション評価をサポートする挑戦的なVIGORベンチマークにおいて、1mレベルのローカライゼーションリコール率は、それぞれ1.53\%から39.64\%に改善され、同じ領域とクロスエリアの評価では0.43\%から25.58\%に改善されていることである。
コードは公開されます。
関連論文リスト
- Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - CurriculumLoc: Enhancing Cross-Domain Geolocalization through
Multi-Stage Refinement [11.108860387261508]
ビジュアルジオローカライゼーションはコスト効率が高くスケーラブルなタスクであり、未知の場所で撮影された1つ以上のクエリイメージとジオタグ付き参照イメージのセットをマッチングする。
我々は,グローバルな意味認識と局所的幾何学的検証を備えたキーポイント検出と記述法であるCurriculumLocを開発した。
我々は、ALTOで62.6%と94.5%の新しいハイリコール@1スコアをそれぞれ2つの異なる距離で達成した。
論文 参考訳(メタデータ) (2023-11-20T08:40:01Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - Cross-view Geo-localization via Learning Disentangled Geometric Layout
Correspondence [11.823147814005411]
クロスビュージオローカライゼーションは、参照ジオタグ付き空中画像データベースとマッチングすることで、クエリーグラウンド画像の位置を推定することを目的としている。
最近の研究は、クロスビューなジオローカライゼーションベンチマークにおいて顕著な進歩を遂げている。
しかし、既存の手法は依然としてクロスエリアベンチマークのパフォーマンスの低下に悩まされている。
論文 参考訳(メタデータ) (2022-12-08T04:54:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。