論文の概要: Road Maps as Free Geometric Priors: Weather-Invariant Drone Geo-Localization with GeoFuse
- arxiv url: http://arxiv.org/abs/2605.14925v1
- Date: Thu, 14 May 2026 15:01:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.895202
- Title: Road Maps as Free Geometric Priors: Weather-Invariant Drone Geo-Localization with GeoFuse
- Title(参考訳): 自由幾何学的先駆者としての道路地図:GeoFuseを用いた気象不変ドローンジオローカライゼーション
- Authors: Yunsong Fang, Tingyu Wang, Zhedong Zheng,
- Abstract要約: ドローンビューのジオローカライゼーションは、しばしば悪天候下で撮影されたクエリードローン画像と、ジオタグ付き衛星画像のギャラリーとをマッチングすることを目的としている。
気象によって引き起こされるドローンの視界の劣化は、本質的なクロスビュー領域のギャップを著しく悪化させる。
衛星画像と正確に整列した道路地図タイルを統合したクロスモーダル融合フレームワークであるGeoFuseを紹介する。
- 参考スコア(独自算出の注目度): 20.496826407313854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Drone-view geo-localization aims to match a query drone image, often captured under adverse weather conditions (e.g., rain, snow, fog), against a gallery of geo-tagged satellite images. Weather-induced degradations in the drone view, such as noise, reduced visibility, and partial occlusions, severely exacerbate the intrinsic cross-view domain gap. While prior methods predominantly rely on weather-specific architectures or data augmentations, they have largely overlooked road map data, a readily available modality that provides strong, inherently weather-invariant geometric layout cues (e.g., road networks and building footprints) at negligible additional cost. We introduce GeoFuse, a cross-modal fusion framework that integrates precisely aligned road map tiles with satellite imagery to yield more discriminative and weather-resilient representations. We first augment the existing University-1652 and DenseUAV benchmarks with geo-aligned road maps, supplying structural priors robust to meteorological variations. Building on this, we propose a flexible fusion module that combines satellite and road map features via token-level and channel-level interactions, with a lightweight dynamic gating mechanism that adaptively weights modality contributions per instance. Finally, we employ class-level cross-view contrastive learning to promote robust alignment between weather-degraded drone features and the fused satellite-roadmap representations. Extensive experiments under diverse weather conditions show that GeoFuse consistently outperforms state-of-the-art methods, achieving +3.46% and +23.18% Recall@1 accuracy on the University-1652 and DenseUAV benchmarks, respectively.
- Abstract(参考訳): ドローンビューのジオローカライゼーションは、しばしば悪天候(雨、雪、霧など)下で撮影されるクエリー・ドローンの画像と、ジオタグ付き衛星画像のギャラリーとをマッチングすることを目的としている。
騒音、可視性低下、部分閉塞など、天候に起因したドローンの視界の劣化は、本質的なクロスビュー領域ギャップを著しく悪化させる。
以前の手法は、主に気象特化アーキテクチャやデータ拡張に依存していたが、概ね見過ごされた道路地図データがあり、これは、強い、本質的には気象不変な幾何学的レイアウト(例えば、道路ネットワークや建築フットプリントなど)を、無視できる追加コストで提供する、容易に利用できるモダリティである。
道路地図タイルを正確に整列した衛星画像と統合して、より差別的で耐候性のある表現を提供する、クロスモーダル融合フレームワークであるGeoFuseを紹介した。
まず,既存のUniversity-1652とDenseUAVベンチマークをジオアライズした道路地図で拡張し,気象変動に頑健な構造的事前情報を提供する。
これに基づいて,トークンレベルとチャネルレベルの相互作用を通じて,衛星と道路マップの特徴を組み合わせたフレキシブルな融合モジュールと,インスタンスごとのモダリティ貢献を適応的に重み付けする軽量な動的ゲーティング機構を提案する。
最後に、気象劣化したドローンの特徴と融合した衛星ロードマップ表現との堅牢な整合性を促進するために、クラスレベルのコントラスト学習を採用する。
多様な気象条件下での大規模な実験により、GeoFuseは、大学-1652とDenseUAVのベンチマークで、それぞれ+3.46%と+23.18%のリコール@1の精度で、最先端の手法を一貫して上回っていることが示されている。
関連論文リスト
- Unifying UAV Cross-View Geo-Localization via 3D Geometric Perception [51.687842983240564]
無人航空機(UAV)のクロスビューな地上局地化は、斜めのUAV画像と衛星地図との厳密な幾何学的相違により、いまだに困難である。
本稿では,3次元シーン形状を明示的にモデル化し,粗い位置認識ときめ細かなポーズ推定を統一する,幾何認識型UAV測位フレームワークを提案する。
提案手法は, 最先端のベースラインを著しく上回り, ロバストメータレベルのローカライゼーション精度を実現し, 複雑な都市環境における一般化を向上する。
論文 参考訳(メタデータ) (2026-04-02T08:08:41Z) - S$^2$Transformer: Scalable Structured Transformers for Global Station Weather Forecasting [67.93713728260646]
既存の時系列予測手法は、大規模なグローバルステーション予測を行う際に、空間的相関を無視または一方向的にモデル化することが多い。
これは、予測性能を制限する地球規模の気象システムの観測の根底にある性質と矛盾する。
本稿では,構造的空間的注意を新たに提案する。
空間グラフを一連のサブグラフに分割し、サブグラフ内の注意をインスタンス化し、各サブグラフ内の局所的な空間相関を学習する。
ノードをサブグラフ間のメッセージパッシングのためのサブグラフ表現に集約する。
論文 参考訳(メタデータ) (2025-09-10T05:33:28Z) - EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。
また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。
CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文 参考訳(メタデータ) (2025-04-28T02:41:12Z) - Style Alignment based Dynamic Observation Method for UAV-View Geo-localization [7.185123213523453]
UAVビューのジオローカライゼーションのためのスタイルアライメントに基づく動的観察法を提案する。
具体的には、ドローンビュー画像の多様な視覚スタイルから衛星画像の統一的な視覚スタイルへ変換するスタイルアライメント戦略を導入する。
動的観察モジュールは、人間の観察習慣を模倣して画像の空間分布を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-03T06:19:42Z) - STHN: Deep Homography Estimation for UAV Thermal Geo-localization with Satellite Imagery [15.135871604577444]
粗大から細い深部ホログラフィー推定手法を用いたUAV熱ジオローカライズ手法を提案する。
この方法は、UAVの最後の位置から半径512メートル以内で、信頼性の高い熱的位置決めを可能にする。
論文 参考訳(メタデータ) (2024-05-30T20:41:12Z) - Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。
本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。
カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文 参考訳(メタデータ) (2024-04-11T10:26:40Z) - Boosting 3-DoF Ground-to-Satellite Camera Localization Accuracy via
Geometry-Guided Cross-View Transformer [66.82008165644892]
地上レベルの画像と一致/検索衛星画像との相対的な回転と変換を推定することにより、地上カメラの位置と方向の精度を向上させる手法を提案する。
実験の結果,本手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-16T11:52:27Z) - Long-range UAV Thermal Geo-localization with Satellite Imagery [3.427912625787135]
本稿では,衛星RGB画像を用いた新しい熱的ジオローカライズフレームワークを提案する。
これには、熱画像と衛星画像のペア化の限界に対処する複数のドメイン適応方法が含まれる。
我々の知る限り、この研究は、長距離飛行における衛星RGB画像を用いた熱的ジオローカライズ法を初めて提案したものである。
論文 参考訳(メタデータ) (2023-06-05T16:05:57Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。