論文の概要: Relative Distance Guided Dynamic Partition Learning for Scale-Invariant UAV-View Geo-Localization
- arxiv url: http://arxiv.org/abs/2412.11535v2
- Date: Mon, 23 Dec 2024 14:17:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 19:20:48.080732
- Title: Relative Distance Guided Dynamic Partition Learning for Scale-Invariant UAV-View Geo-Localization
- Title(参考訳): 大規模不変UAV-Viewジオローカライゼーションのための相対距離ガイド動的分割学習
- Authors: Quan Chen, Tingyu Wang, Rongfeng Lu, Bolun Zheng, Zhedong Zheng, Chenggang Yan,
- Abstract要約: UAV-view Geo-Localization (UVGL) は、特にドローンが捉えた画像と衛星視界との視界の相違により、大きな課題を生んでいる。
相対的距離に基づく分割学習フレームワークを提案し,粒度の細かい特徴をマイニングしながらスケールの一貫性への依存を軽減する。
提案手法は, 様々なスケール不整合シナリオにおいて, 高精度な局所化精度を実現し, スケール変動に対する顕著なロバスト性を示す。
- 参考スコア(独自算出の注目度): 37.30243235827088
- License:
- Abstract: UAV-view Geo-Localization~(UVGL) presents substantial challenges, particularly due to the disparity in visual appearance between drone-captured imagery and satellite perspectives. Existing methods usually assume consistent scaling factor across different views. Therefore, they adopt predefined partition alignment and extract viewpoint-invariant representation by constructing a variety of part-level features. However, the scaling assumption is not always hold in the real-world scenarios that variations of UAV flight state leads to the scale mismatch of cross-views, resulting in serious performance degradation. To overcome this issue, we propose a partition learning framework based on relative distance, which alleviates the dependence on scale consistency while mining fine-grained features. Specifically, we propose a distance guided dynamic partition learning strategy~(DGDPL), consisting of a square partition strategy and a distance-guided adjustment strategy. The former is utilized to extract fine-grained features and global features in a simple manner. The latter calculates the relative distance ratio between drone- and satellite-view to adjust the partition size, thereby explicitly aligning the semantic information between partition pairs. Furthermore, we propose a saliency-guided refinement strategy to refine part-level features, so as to further improve the retrieval accuracy. Extensive experiments show that our approach achieves superior geo-localization accuracy across various scale-inconsistent scenarios, and exhibits remarkable robustness against scale variations. The code will be released.
- Abstract(参考訳): UAV-view Geo-Localization~(UVGL)は、特にドローンが捉えた画像と衛星視界との視界の相違により、大きな課題を提示している。
既存のメソッドは通常、異なるビューに対して一貫したスケーリングファクタを前提とします。
そのため、事前に定義された分割アライメントを採用し、様々な部分レベルの特徴を構築することで視点不変表現を抽出する。
しかし、UAV飛行状態の変動がクロスビューのスケールミスマッチにつながるという現実のシナリオでは、スケーリングの仮定が常に成り立つわけではない。
この問題を克服するために,我々は,細粒度の特徴をマイニングしながら,スケール一貫性への依存を軽減する,相対距離に基づく分割学習フレームワークを提案する。
具体的には、二乗分割戦略と距離誘導調整戦略からなる距離誘導動的分割学習戦略~(DGDPL)を提案する。
前者は簡単な方法で微細な特徴やグローバルな特徴を抽出するために利用される。
後者は、ドローンと衛星ビュー間の相対距離比を算出し、分割サイズを調整することにより、分割ペア間の意味情報を明示的に整合させる。
さらに,部分レベルの特徴を洗練し,検索精度をより高めるために,サリエンシ誘導型改良戦略を提案する。
大規模な実験により,提案手法は大規模不整合シナリオにまたがって優れた地理的局所化精度を達成し,スケール変動に対する顕著な堅牢性を示した。
コードはリリースされます。
関連論文リスト
- Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - G$^2$DA: Geometry-Guided Dual-Alignment Learning for RGB-Infrared Person
Re-Identification [3.909938091041451]
RGB-IRの人物再識別は、異種間の興味のある人物を検索することを目的としている。
本稿では,サンプルレベルのモダリティ差に対処するための幾何誘導デュアルアライメント学習フレームワーク(G$2$DA)を提案する。
論文 参考訳(メタデータ) (2021-06-15T03:14:31Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Foreground-Aware Relation Network for Geospatial Object Segmentation in
High Spatial Resolution Remote Sensing Imagery [6.4901484665257545]
地空間オブジェクトセグメンテーションは、常に大きなスケールの変動、背景のクラス内ばらつき、前景と背景の不均衡に直面している。
本稿では,フォアグラウンド・アウェア・リレーション・ネットワーク(FarSeg)を提案する。
実験により、FarSegは最先端の汎用セマンティックセグメンテーション法よりも優れており、速度と精度のトレードオフがより良好であることが示された。
論文 参考訳(メタデータ) (2020-11-19T10:57:43Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z) - Multi-view Drone-based Geo-localization via Style and Spatial Alignment [47.95626612936813]
マルチビュー・マルチソース・ジオローカライゼーションは、ドローンビュー画像と衛星ビュー画像とを事前アノテーション付きGPSタグとマッチングすることにより、GPS位置決めの重要な補助的手法として機能する。
パターンを整列させるエレガントな配向に基づく手法を提案し、整列部分特徴を抽出する新しい分岐を導入する。
論文 参考訳(メタデータ) (2020-06-23T15:44:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。