論文の概要: Relative Distance Guided Dynamic Partition Learning for Scale-Invariant UAV-View Geo-Localization
- arxiv url: http://arxiv.org/abs/2412.11535v2
- Date: Mon, 23 Dec 2024 14:17:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 19:20:48.080732
- Title: Relative Distance Guided Dynamic Partition Learning for Scale-Invariant UAV-View Geo-Localization
- Title(参考訳): 大規模不変UAV-Viewジオローカライゼーションのための相対距離ガイド動的分割学習
- Authors: Quan Chen, Tingyu Wang, Rongfeng Lu, Bolun Zheng, Zhedong Zheng, Chenggang Yan,
- Abstract要約: UAV-view Geo-Localization (UVGL) は、特にドローンが捉えた画像と衛星視界との視界の相違により、大きな課題を生んでいる。
相対的距離に基づく分割学習フレームワークを提案し,粒度の細かい特徴をマイニングしながらスケールの一貫性への依存を軽減する。
提案手法は, 様々なスケール不整合シナリオにおいて, 高精度な局所化精度を実現し, スケール変動に対する顕著なロバスト性を示す。
- 参考スコア(独自算出の注目度): 37.30243235827088
- License:
- Abstract: UAV-view Geo-Localization~(UVGL) presents substantial challenges, particularly due to the disparity in visual appearance between drone-captured imagery and satellite perspectives. Existing methods usually assume consistent scaling factor across different views. Therefore, they adopt predefined partition alignment and extract viewpoint-invariant representation by constructing a variety of part-level features. However, the scaling assumption is not always hold in the real-world scenarios that variations of UAV flight state leads to the scale mismatch of cross-views, resulting in serious performance degradation. To overcome this issue, we propose a partition learning framework based on relative distance, which alleviates the dependence on scale consistency while mining fine-grained features. Specifically, we propose a distance guided dynamic partition learning strategy~(DGDPL), consisting of a square partition strategy and a distance-guided adjustment strategy. The former is utilized to extract fine-grained features and global features in a simple manner. The latter calculates the relative distance ratio between drone- and satellite-view to adjust the partition size, thereby explicitly aligning the semantic information between partition pairs. Furthermore, we propose a saliency-guided refinement strategy to refine part-level features, so as to further improve the retrieval accuracy. Extensive experiments show that our approach achieves superior geo-localization accuracy across various scale-inconsistent scenarios, and exhibits remarkable robustness against scale variations. The code will be released.
- Abstract(参考訳): UAV-view Geo-Localization~(UVGL)は、特にドローンが捉えた画像と衛星視界との視界の相違により、大きな課題を提示している。
既存のメソッドは通常、異なるビューに対して一貫したスケーリングファクタを前提とします。
そのため、事前に定義された分割アライメントを採用し、様々な部分レベルの特徴を構築することで視点不変表現を抽出する。
しかし、UAV飛行状態の変動がクロスビューのスケールミスマッチにつながるという現実のシナリオでは、スケーリングの仮定が常に成り立つわけではない。
この問題を克服するために,我々は,細粒度の特徴をマイニングしながら,スケール一貫性への依存を軽減する,相対距離に基づく分割学習フレームワークを提案する。
具体的には、二乗分割戦略と距離誘導調整戦略からなる距離誘導動的分割学習戦略~(DGDPL)を提案する。
前者は簡単な方法で微細な特徴やグローバルな特徴を抽出するために利用される。
後者は、ドローンと衛星ビュー間の相対距離比を算出し、分割サイズを調整することにより、分割ペア間の意味情報を明示的に整合させる。
さらに,部分レベルの特徴を洗練し,検索精度をより高めるために,サリエンシ誘導型改良戦略を提案する。
大規模な実験により,提案手法は大規模不整合シナリオにまたがって優れた地理的局所化精度を達成し,スケール変動に対する顕著な堅牢性を示した。
コードはリリースされます。
関連論文リスト
- Multi-Level Embedding and Alignment Network with Consistency and Invariance Learning for Cross-View Geo-Localization [2.733505168507872]
CVGL(Cross-View Geo-Localization)は、最もよく似たGPSタグ付き衛星画像を取得することで、ドローン画像のローカライゼーションを決定する。
既存の手法は、モデルの性能を改善する際に、計算と記憶の要求が増大する問題をしばしば見落としている。
マルチレベル・エンベディング・アライメント・ネットワーク(MEAN)と呼ばれる軽量なアライメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2024-12-19T13:10:38Z) - ConGeo: Robust Cross-view Geo-localization across Ground View Variations [34.192775134189965]
クロスビューなジオローカライゼーションは,地上レベルのクエリイメージを対応するジオレファレンスな空中ビューとマッチングすることで,ローカライズすることを目的としている。
既存の学習パイプラインはオリエンテーションに特化しているか、FoVに特化している。
本研究では,地形定位のためのコントラスト法であるConGeoを提案する。
論文 参考訳(メタデータ) (2024-03-20T20:37:13Z) - Adaptive Spot-Guided Transformer for Consistent Local Feature Matching [64.30749838423922]
局所的特徴マッチングのための適応スポットガイド変換器(ASTR)を提案する。
ASTRは、統一された粗いアーキテクチャにおける局所的な一貫性とスケールのバリエーションをモデル化する。
論文 参考訳(メタデータ) (2023-03-29T12:28:01Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - G$^2$DA: Geometry-Guided Dual-Alignment Learning for RGB-Infrared Person
Re-Identification [3.909938091041451]
RGB-IRの人物再識別は、異種間の興味のある人物を検索することを目的としている。
本稿では,サンプルレベルのモダリティ差に対処するための幾何誘導デュアルアライメント学習フレームワーク(G$2$DA)を提案する。
論文 参考訳(メタデータ) (2021-06-15T03:14:31Z) - Foreground-Aware Relation Network for Geospatial Object Segmentation in
High Spatial Resolution Remote Sensing Imagery [6.4901484665257545]
地空間オブジェクトセグメンテーションは、常に大きなスケールの変動、背景のクラス内ばらつき、前景と背景の不均衡に直面している。
本稿では,フォアグラウンド・アウェア・リレーション・ネットワーク(FarSeg)を提案する。
実験により、FarSegは最先端の汎用セマンティックセグメンテーション法よりも優れており、速度と精度のトレードオフがより良好であることが示された。
論文 参考訳(メタデータ) (2020-11-19T10:57:43Z) - Multi-view Drone-based Geo-localization via Style and Spatial Alignment [47.95626612936813]
マルチビュー・マルチソース・ジオローカライゼーションは、ドローンビュー画像と衛星ビュー画像とを事前アノテーション付きGPSタグとマッチングすることにより、GPS位置決めの重要な補助的手法として機能する。
パターンを整列させるエレガントな配向に基づく手法を提案し、整列部分特徴を抽出する新しい分岐を導入する。
論文 参考訳(メタデータ) (2020-06-23T15:44:02Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z) - Self-Guided Adaptation: Progressive Representation Alignment for Domain
Adaptive Object Detection [86.69077525494106]
非教師なしドメイン適応(UDA)は、オブジェクト検出モデルのドメイン間ロバスト性を改善するために前例のない成功を収めた。
既存のUDA手法は、モデル学習中の瞬間的なデータ分布を無視しており、大きなドメインシフトによって特徴表現が劣化する可能性がある。
本稿では、特徴表現の整合とドメイン間のオブジェクト検出モデルの転送を目標とする自己ガイド適応モデルを提案する。
論文 参考訳(メタデータ) (2020-03-19T13:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。