論文の概要: Scale-Aware UAV-to-Satellite Cross-View Geo-Localization: A Semantic Geometric Approach
- arxiv url: http://arxiv.org/abs/2603.07535v1
- Date: Sun, 08 Mar 2026 08:51:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.788177
- Title: Scale-Aware UAV-to-Satellite Cross-View Geo-Localization: A Semantic Geometric Approach
- Title(参考訳): スケール対応UAV-サテライトクロスビュージオローカライゼーション:意味幾何学的アプローチ
- Authors: Yibin Ye, Shuo Chen, Kun Wang, Xiaokai Song, Jisheng Dang, Qifeng Yu, Xichao Teng, Zhang Li,
- Abstract要約: UAV画像と衛星画像のクロスビュージオローカライゼーションは、標的位置決めとUAV自己配置において重要な役割を担っている。
既存の手法のほとんどは、UAVクエリと衛星ギャラリー間のスケール一貫性の理想的な仮定に依存している。
この不一致は視野のずれや特徴ミスマッチを引き起こし、CVGLの堅牢性を著しく低下させる。
意味アンカーを用いた単眼UAV画像から絶対距離を復元する幾何学的枠組みを提案する。
- 参考スコア(独自算出の注目度): 15.415356946083861
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-View Geo-Localization (CVGL) between UAV imagery and satellite images plays a crucial role in target localization and UAV self-positioning. However, most existing methods rely on the idealized assumption of scale consistency between UAV queries and satellite galleries, overlooking the severe scale ambiguity commonly encountered in real-world scenarios. This discrepancy leads to field-of-view misalignment and feature mismatch, significantly degrading CVGL robustness. To address this issue, we propose a geometric framework that recovers the absolute metric scale from monocular UAV images using semantic anchors. Specifically, small vehicles (SVs), characterized by relatively stable prior size distributions and high detectability, are exploited as metric references. A Decoupled Stereoscopic Projection Model is introduced to estimate the absolute image scale from these semantic targets. By decomposing vehicle dimensions into radial and tangential components, the model compensates for perspective distortions in 2D detections of 3D vehicles, enabling more accurate scale estimation. To further reduce intra-class size variation and detection noise, a dual-dimension fusion strategy with Interquartile Range (IQR)-based robust aggregation is employed. The estimated global scale is then used as a physical constraint for scale-adaptive satellite image cropping, improving UAV-to-satellite feature alignment. Experiments on augmented DenseUAV and UAV-VisLoc datasets demonstrate that the proposed method significantly improves CVGL robustness under unknown UAV image scales. Additionally, the framework shows strong potential for downstream applications such as passive UAV altitude estimation and 3D model scale recovery.
- Abstract(参考訳): UAV画像と衛星画像とのクロスビュージオローカライゼーション(CVGL)は、ターゲット位置決めとUAV自己配置において重要な役割を果たす。
しかし、既存のほとんどの手法は、UAVクエリと衛星ギャラリーのスケール一貫性の理想的な仮定に依存しており、現実のシナリオでよく見られる厳密なスケールの曖昧さを見越している。
この不一致は視野のずれや特徴ミスマッチを引き起こし、CVGLの堅牢性を著しく低下させる。
この問題に対処するために,セマンティックアンカーを用いた単眼UAV画像から絶対測度スケールを復元する幾何学的枠組みを提案する。
具体的には、比較的安定な事前サイズ分布と高い検出性によって特徴付けられる小型車両(SV)をメートル法基準として活用する。
分離立体射影モデルを導入し、これらのセマンティックターゲットから絶対的な画像スケールを推定する。
車両次元を半径成分と接点成分に分解することにより、3次元車両の2次元検出における視点歪みを補正し、より正確なスケール推定を可能にする。
さらに、クラス内サイズの変化や検出ノイズを低減するために、IQR(Interquartile Range)ベースのロバストアグリゲーションを用いた二重次元融合戦略を採用している。
推定されたグローバルスケールは、スケール適応型衛星画像収集の物理的制約として使われ、UAV-衛星特徴アライメントが改善された。
拡張されたDenseUAVおよびUAV-VisLocデータセットの実験により、提案手法は未知のUAV画像スケール下でCVGLのロバスト性を大幅に向上することを示した。
さらに、このフレームワークは、受動UAV高度推定や3次元モデルスケール回復のような下流アプリケーションに強い可能性を示している。
関連論文リスト
- Enhancing Cross-View UAV Geolocalization via LVLM-Driven Relational Modeling [31.36539752384395]
クロスビューUAVジオローカライゼーションは、ドローンが捉えた画像の正確な空間座標を、地理的に参照された広範囲な衛星データベースと整列させることを目的としている。
改良されたUAV-Satellite画像マッチングのための共同関係モデリングを明示的に行うために設計された,新しいプラグアンドプレイランキングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2026-03-09T07:57:29Z) - Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.57282092735991]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。
地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。
実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文 参考訳(メタデータ) (2025-09-11T18:52:16Z) - Zero-shot Inexact CAD Model Alignment from a Single Image [53.37898107159792]
1つの画像から3Dシーン構造を推測する実践的なアプローチは、データベースから密に一致する3Dモデルを検索し、画像内のオブジェクトと整列させることである。
既存のメソッドは、イメージによる教師付きトレーニングとアノテーションのポーズに依存しており、オブジェクトカテゴリの狭いセットに制限されている。
ポーズアノテーションを必要とせず、未知のカテゴリに一般化する不正確な3次元モデルの弱い教師付き9-DoFアライメント法を提案する。
論文 参考訳(メタデータ) (2025-07-04T04:46:59Z) - A Deep Learning Framework with Geographic Information Adaptive Loss for Remote Sensing Images based UAV Self-Positioning [10.16507150219648]
GPSデニド環境におけるUAVの自己配置は重要な目標となっている。
本稿では,地理的情報適応的損失を伴う深層学習フレームワークを提案する。
その結果、UAVが正確な自己配置を実現するための方法の有効性が示された。
論文 参考訳(メタデータ) (2025-02-22T09:36:34Z) - Unsupervised Multi-view UAV Image Geo-localization via Iterative Rendering [31.716967688739036]
無人航空機 (UAV) クロスビュージオローカライゼーション (CVGL) は重要な課題である。
既存の手法は、ビュー横断検索のための視点不変の特徴を抽出するためにラベル付きデータセットの監督に依存している。
衛星画像生成のためのUAV観測から3次元空間にシーン表現を持ち上げる教師なしのソリューションを提案する。
論文 参考訳(メタデータ) (2024-11-22T09:22:39Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Vision-Based UAV Self-Positioning in Low-Altitude Urban Environments [20.69412701553767]
無人航空機(UAV)は安定した位置決めのために衛星システムに依存している。
このような状況下では、視覚に基づく技術が代替手段として機能し、UAVの自己配置能力を確実にする。
本稿では,UAV自己配置タスク用に設計された最初の公開データセットであるDenseUAVを提案する。
論文 参考訳(メタデータ) (2022-01-23T07:18:55Z) - Distributed Variable-Baseline Stereo SLAM from two UAVs [17.513645771137178]
本稿では,単眼カメラを1台,IMUを1台搭載した2台のUAVを用いて,視界の重なりと相対距離の測定を行った。
本稿では,glsuavエージェントを自律的に制御するために,分散協調推定方式を提案する。
我々は,高度160mまでの飛行におけるアプローチの有効性を実証し,最先端のVIO手法の能力を大きく超えている。
論文 参考訳(メタデータ) (2020-09-10T12:16:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。