論文の概要: Scale-adaptive UAV Geo-localization via Height-aware Partition Learning
- arxiv url: http://arxiv.org/abs/2412.11535v3
- Date: Wed, 02 Apr 2025 11:36:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:16:19.064575
- Title: Scale-adaptive UAV Geo-localization via Height-aware Partition Learning
- Title(参考訳): ハイト・アウェア・パーティション・ラーニングによるスケール適応型UAV測地
- Authors: Quan Chen, Tingyu Wang, Rongfeng Lu, Yu Liu, Bolun Zheng, Zhedong Zheng,
- Abstract要約: UAVのジオローカライゼーションは、ドローンが撮影した画像と衛星の視界との間に大きな違いがあるため、大きな課題に直面している。
既存のメソッドは通常、ビュー間で一貫したスケーリングファクタを仮定し、事前に定義されたパーティションアライメントに依存します。
本研究では、既知のドローンの飛行高度を利用して、スケール要因を予測し、特徴抽出を動的に調整するスケール適応型分割学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 22.72128308133626
- License:
- Abstract: UAV Geo-Localization faces significant challenges due to the drastic appearance discrepancy between dronecaptured images and satellite views. Existing methods typically assume a consistent scaling factor across views and rely on predefined partition alignment to extract viewpoint-invariant representations through part-level feature construction. However, this scaling assumption often fails in real-world scenarios, where variations in drone flight states lead to scale mismatches between cross-view images, resulting in severe performance degradation. To address this issue, we propose a scale-adaptive partition learning framework that leverages known drone flight height to predict scale factors and dynamically adjust feature extraction. Our key contribution is a height-aware adjustment strategy, which calculates the relative height ratio between drone and satellite views, dynamically adjusting partition sizes to explicitly align semantic information between partition pairs. This strategy is integrated into a Scale-adaptive Local Partition Network (SaLPN), building upon an existing square partition strategy to extract both finegrained and global features. Additionally, we propose a saliencyguided refinement strategy to enhance part-level features, further improving retrieval accuracy. Extensive experiments validate that our height-aware, scale-adaptive approach achieves stateof-the-art geo-localization accuracy in various scale-inconsistent scenarios and exhibits strong robustness against scale variations. The code will be made publicly available.
- Abstract(参考訳): UAVのジオローカライゼーションは、ドローンが撮影した画像と衛星の視界との間に大きな違いがあるため、大きな課題に直面している。
既存のメソッドは通常、ビュー間で一貫したスケーリング係数を仮定し、部分レベルの特徴構成を通じて視点不変表現を抽出するために、事前に定義された分割アライメントに依存します。
しかし、このスケーリングの前提はしばしば現実のシナリオで失敗し、ドローンの飛行状態の変化は、クロスビュー画像間のミスマッチをスケールし、パフォーマンスが著しく低下する。
この問題に対処するために、既知のドローンの飛行高度を利用してスケール要因を予測し、特徴抽出を動的に調整するスケール適応型分割学習フレームワークを提案する。
ドローンと衛星ビューの相対的高さ比を計算し、パーティションサイズを動的に調整し、パーティションペア間のセマンティック情報を明示的に調整する。
この戦略は、スケール適応ローカルパーティションネットワーク(SaLPN)に統合され、既存の正方形パーティション戦略に基づいて、きめ細かい機能とグローバルな機能の両方を抽出する。
さらに,部分レベルの特徴を向上し,精度の向上を図るために,サリエンシ誘導型改良戦略を提案する。
大規模不整合のシナリオにおいて,我々の高度適応型アプローチが最先端のジオローカライゼーション精度を実現し,スケール変動に対して強い堅牢性を示すことを実証した。
コードは公開されます。
関連論文リスト
- Multi-Level Embedding and Alignment Network with Consistency and Invariance Learning for Cross-View Geo-Localization [2.733505168507872]
CVGL(Cross-View Geo-Localization)は、最もよく似たGPSタグ付き衛星画像を取得することで、ドローン画像のローカライゼーションを決定する。
既存の手法は、モデルの性能を改善する際に、計算と記憶の要求が増大する問題をしばしば見落としている。
マルチレベル・エンベディング・アライメント・ネットワーク(MEAN)と呼ばれる軽量なアライメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2024-12-19T13:10:38Z) - ConGeo: Robust Cross-view Geo-localization across Ground View Variations [34.192775134189965]
クロスビューなジオローカライゼーションは,地上レベルのクエリイメージを対応するジオレファレンスな空中ビューとマッチングすることで,ローカライズすることを目的としている。
既存の学習パイプラインはオリエンテーションに特化しているか、FoVに特化している。
本研究では,地形定位のためのコントラスト法であるConGeoを提案する。
論文 参考訳(メタデータ) (2024-03-20T20:37:13Z) - Adaptive Spot-Guided Transformer for Consistent Local Feature Matching [64.30749838423922]
局所的特徴マッチングのための適応スポットガイド変換器(ASTR)を提案する。
ASTRは、統一された粗いアーキテクチャにおける局所的な一貫性とスケールのバリエーションをモデル化する。
論文 参考訳(メタデータ) (2023-03-29T12:28:01Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - G$^2$DA: Geometry-Guided Dual-Alignment Learning for RGB-Infrared Person
Re-Identification [3.909938091041451]
RGB-IRの人物再識別は、異種間の興味のある人物を検索することを目的としている。
本稿では,サンプルレベルのモダリティ差に対処するための幾何誘導デュアルアライメント学習フレームワーク(G$2$DA)を提案する。
論文 参考訳(メタデータ) (2021-06-15T03:14:31Z) - Foreground-Aware Relation Network for Geospatial Object Segmentation in
High Spatial Resolution Remote Sensing Imagery [6.4901484665257545]
地空間オブジェクトセグメンテーションは、常に大きなスケールの変動、背景のクラス内ばらつき、前景と背景の不均衡に直面している。
本稿では,フォアグラウンド・アウェア・リレーション・ネットワーク(FarSeg)を提案する。
実験により、FarSegは最先端の汎用セマンティックセグメンテーション法よりも優れており、速度と精度のトレードオフがより良好であることが示された。
論文 参考訳(メタデータ) (2020-11-19T10:57:43Z) - Multi-view Drone-based Geo-localization via Style and Spatial Alignment [47.95626612936813]
マルチビュー・マルチソース・ジオローカライゼーションは、ドローンビュー画像と衛星ビュー画像とを事前アノテーション付きGPSタグとマッチングすることにより、GPS位置決めの重要な補助的手法として機能する。
パターンを整列させるエレガントな配向に基づく手法を提案し、整列部分特徴を抽出する新しい分岐を導入する。
論文 参考訳(メタデータ) (2020-06-23T15:44:02Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z) - Self-Guided Adaptation: Progressive Representation Alignment for Domain
Adaptive Object Detection [86.69077525494106]
非教師なしドメイン適応(UDA)は、オブジェクト検出モデルのドメイン間ロバスト性を改善するために前例のない成功を収めた。
既存のUDA手法は、モデル学習中の瞬間的なデータ分布を無視しており、大きなドメインシフトによって特徴表現が劣化する可能性がある。
本稿では、特徴表現の整合とドメイン間のオブジェクト検出モデルの転送を目標とする自己ガイド適応モデルを提案する。
論文 参考訳(メタデータ) (2020-03-19T13:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。