論文の概要: Satellite-Free Training for Drone-View Geo-Localization
- arxiv url: http://arxiv.org/abs/2604.01581v2
- Date: Fri, 03 Apr 2026 03:13:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 12:42:34.273268
- Title: Satellite-Free Training for Drone-View Geo-Localization
- Title(参考訳): 衛星フリーでドローンを視認できるジオローカライゼーション
- Authors: Tao Liu, Yingzhi Zhang, Kan Ren, Xiaoqi Zhao,
- Abstract要約: ドローンビューのジオローカライゼーションは、対応するジオタグ付き衛星タイルを検索することで、GPSで識別された環境におけるドローンの位置を決定することを目的としている。
本稿では,ドローン画像のクロスプラットフォーム対応表現に変換する,衛星フリーのトレーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 23.183491899036138
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Drone-view geo-localization (DVGL) aims to determine the location of drones in GPS-denied environments by retrieving the corresponding geotagged satellite tile from a reference gallery given UAV observations of a location. In many existing formulations, these observations are represented by a single oblique UAV image. In contrast, our satellite-free setting is designed for multi-view UAV sequences, which are used to construct a geometry-normalized UAV-side location representation before cross-view retrieval. Existing approaches rely on satellite imagery during training, either through paired supervision or unsupervised alignment, which limits practical deployment when satellite data are unavailable or restricted. In this paper, we propose a satellite-free training (SFT) framework that converts drone imagery into cross-view compatible representations through three main stages: drone-side 3D scene reconstruction, geometry-based pseudo-orthophoto generation, and satellite-free feature aggregation for retrieval. Specifically, we first reconstruct dense 3D scenes from multi-view drone images using 3D Gaussian splatting and project the reconstructed geometry into pseudo-orthophotos via PCA-guided orthographic projection. This rendering stage operates directly on reconstructed scene geometry without requiring camera parameters at rendering time. Next, we refine these orthophotos with lightweight geometry-guided inpainting to obtain texture-complete drone-side views. Finally, we extract DINOv3 patch features from the generated orthophotos, learn a Fisher vector aggregation model solely from drone data, and reuse it at test time to encode satellite tiles for cross-view retrieval. Experimental results on University-1652 and SUES-200 show that our SFT framework substantially outperforms satellite-free generalization baselines and narrows the gap to methods trained with satellite imagery.
- Abstract(参考訳): ドローンビューのジオローカライゼーション (DVGL) は、位置をUAVで観測すると、対応するジオタグ付き衛星タイルを基準ギャラリーから取り出すことにより、GPSで識別された環境におけるドローンの位置を決定することを目的としている。
多くの既存の定式化において、これらの観測は単一の斜めUAV画像で表される。
対照的に、我々の衛星フリー設定は多視点UAVシーケンス用に設計されており、これは、クロスビュー検索の前に幾何正規化されたUAV側の位置表現を構築するのに使用される。
既存のアプローチは、衛星データが利用できない場合や制限されていない場合の実際の展開を制限する、ペア化された監督または非監督的なアライメントを通じて、訓練中に衛星画像に依存する。
本稿では, ドローン画像から3次元シーン再構成, 幾何学に基づく擬似写真生成, 検索のための衛星不要特徴集約という3つの主要な段階を通じて, クロスビュー対応表現に変換する, 衛星フリートレーニング(SFT)フレームワークを提案する。
具体的には、まず3次元ガウシアンスプラッティングを用いて多視点ドローン画像から密集した3Dシーンを再構成し、PCAガイド撮影による擬似オルソフォトに投影する。
このレンダリングステージは、レンダリング時にカメラパラメータを必要とせずに、再構成されたシーン形状を直接操作する。
次に、テクスチャ完備なドローンサイドビューを得るために、軽量な幾何学誘導塗装でこれらの正光を洗練する。
最後に、生成された正光線からDINOv3パッチの特徴を抽出し、ドローンデータのみからフィッシャーベクトル集約モデルを学習し、テスト時に再利用して、衛星タイルをクロスビュー検索する。
大学1652とSUES-200の実験結果から、我々のSFTフレームワークは衛星自由化ベースラインを大幅に上回り、衛星画像で訓練された手法とのギャップを狭めていることがわかった。
関連論文リスト
- Unifying UAV Cross-View Geo-Localization via 3D Geometric Perception [51.687842983240564]
無人航空機(UAV)のクロスビューな地上局地化は、斜めのUAV画像と衛星地図との厳密な幾何学的相違により、いまだに困難である。
本稿では,3次元シーン形状を明示的にモデル化し,粗い位置認識ときめ細かなポーズ推定を統一する,幾何認識型UAV測位フレームワークを提案する。
提案手法は, 最先端のベースラインを著しく上回り, ロバストメータレベルのローカライゼーション精度を実現し, 複雑な都市環境における一般化を向上する。
論文 参考訳(メタデータ) (2026-04-02T08:08:41Z) - PLANA3R: Zero-shot Metric Planar 3D Reconstruction via Feed-Forward Planar Splatting [56.188624157291024]
提案するPLANA3Rは,提案しない2次元画像から平面3次元再構成を計測するためのポーズレスフレームワークである。
トレーニング中に3次元平面アノテーションを必要とする以前のフィードフォワード法とは異なり、PLANA3Rは明確な平面監督なしで平面3次元構造を学習する。
本研究は,複数の室内環境データセットに対するPLANA3Rの有効性を検証するとともに,領域外屋内環境への強力な一般化を実証する。
論文 参考訳(メタデータ) (2025-10-21T15:15:33Z) - SatDreamer360: Multiview-Consistent Generation of Ground-Level Scenes from Satellite Imagery [18.071734088436077]
衛星画像から幾何的に一貫した地上レベルのパノラマを生成するフレームワークであるSatDreamer360を提案する。
実験により、SatDreamer360は衛星と地上のアライメントとマルチビューの整合性の両方において既存の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-05-31T15:15:54Z) - Game4Loc: A UAV Geo-Localization Benchmark from Game Data [0.0]
クロスビューペアデータの部分的マッチングを含む,より実用的なUAV測位タスクを提案する。
実験により,UAV測地のためのデータとトレーニング手法の有効性が示された。
論文 参考訳(メタデータ) (2024-09-25T13:33:28Z) - UAV-VisLoc: A Large-scale Dataset for UAV Visual Localization [20.37586403749362]
大規模なUAV-VisLocデータセットを提示し、UAV視覚的ローカライゼーション作業を容易にする。
われわれのデータセットには6,742枚のドローン画像と11個の衛星マップが含まれており、緯度、経度、高度、捕獲日などのメタデータがある。
論文 参考訳(メタデータ) (2024-05-20T10:24:10Z) - Sat2Scene: 3D Urban Scene Generation from Satellite Images with Diffusion [77.34078223594686]
本稿では,3次元スパース表現に拡散モデルを導入し,それらをニューラルレンダリング技術と組み合わせることで,直接3次元シーン生成のための新しいアーキテクチャを提案する。
具体的には、まず3次元拡散モデルを用いて、所定の幾何学の点レベルのテクスチャ色を生成し、次にフィードフォワード方式でシーン表現に変換する。
2つの都市規模データセットを用いた実験により,衛星画像から写真リアルなストリートビュー画像シーケンスとクロスビュー都市シーンを生成する能力を示した。
論文 参考訳(メタデータ) (2024-01-19T16:15:37Z) - Satellite Image Based Cross-view Localization for Autonomous Vehicle [59.72040418584396]
本稿では,市販の高精細衛星画像を使用可能な地図として利用することにより,良好な精度でクロスビュー車両のローカライゼーションを実現することができることを示す。
本手法はKITTIとFord Multi-AVの季節データセットを地上ビューとして,Google Mapsを衛星ビューとして検証した。
論文 参考訳(メタデータ) (2022-07-27T13:16:39Z) - University-1652: A Multi-view Multi-source Benchmark for Drone-based
Geo-localization [87.74121935246937]
我々は、ドローンによるジオローカライゼーションのための新しいマルチビューベンチマーク、University-1652を紹介する。
大学1652は、世界中の1,652の大学の建物から合成ドローン、衛星、地上カメラなどの3つのプラットフォームからのデータを含んでいる。
実験の結果,University-1652は視点不変の特徴の学習を支援し,実世界のシナリオにおいて優れた一般化能力を有することが示された。
論文 参考訳(メタデータ) (2020-02-27T15:24:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。