論文の概要: Without Paired Labeled Data: An End-to-End Self-Supervised Paradigm for UAV-View Geo-Localization
- arxiv url: http://arxiv.org/abs/2502.11381v2
- Date: Tue, 01 Apr 2025 03:44:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-02 14:13:33.201196
- Title: Without Paired Labeled Data: An End-to-End Self-Supervised Paradigm for UAV-View Geo-Localization
- Title(参考訳): ラベルなしラベル付きデータ:UAV-Viewジオローカライゼーションのためのエンド・ツー・エンドセルフ・スーパービジョン・パラダイム
- Authors: Zhongwei Chen, Zhao-Xu Yang, Hai-Jun Rong,
- Abstract要約: UAV-View Geo-Localization (UVGL) は、無人航空機(UAV)の正確な位置決めを実現するために、GPSタグ付き衛星画像を取得することを目的としている。
既存の手法は、教師あり学習のための事前ペア付きUAVサテライト画像に大きく依存している。
本稿では,これらの制限を克服するために,エンドツーエンドの自己教師付きUVGL手法を提案する。
- 参考スコア(独自算出の注目度): 2.733505168507872
- License:
- Abstract: UAV-View Geo-Localization (UVGL) aims to achieve accurate localization of unmanned aerial vehicles (UAVs) by retrieving the most relevant GPS-tagged satellite images. However, existing methods heavily rely on pre-paired UAV-satellite images for supervised learning. Such dependency not only incurs high annotation costs but also severely limits scalability and practical deployment in open-world UVGL scenarios. To address these limitations, we propose an end-to-end self-supervised UVGL method. Our method leverages a shallow backbone network to extract initial features, employs clustering to generate pseudo labels, and adopts a dual-path contrastive learning architecture to learn discriminative intra-view representations. Furthermore, our method incorporates two core modules, the dynamic hierarchical memory learning module and the information consistency evolution learning module. The dynamic hierarchical memory learning module combines short-term and long-term memory to enhance intra-view feature consistency and discriminability. Meanwhile, the information consistency evolution learning module leverages a neighborhood-driven dynamic constraint mechanism to systematically capture implicit cross-view semantic correlations, thereby improving cross-view feature alignment. To further stabilize and strengthen the self-supervised training process, a pseudo-label enhancement strategy is introduced, which refines the quality of pseudo supervision. Our method ultimately constructs a unified cross-view feature representation space under self-supervised settings. Extensive experiments on three public benchmark datasets demonstrate that the proposed method consistently outperforms existing self-supervised methods and even surpasses several state-of-the-art supervised methods. Our code is available at https://github.com/ISChenawei/DMNIL.
- Abstract(参考訳): UAV-View Geo-Localization (UVGL) は、無人航空機(UAV)の正確な位置決めを実現するために、GPSタグ付き衛星画像を取得することを目的としている。
しかし、既存の手法は教師あり学習のための事前ペア付きUAV衛星画像に大きく依存している。
このような依存関係は、高いアノテーションコストを発生させるだけでなく、オープンワールドなUVGLシナリオにおけるスケーラビリティと実践的なデプロイメントを著しく制限します。
これらの制約に対処するため,エンド・ツー・エンドの自己監督型UVGL法を提案する。
提案手法は浅いバックボーンネットワークを利用して初期特徴を抽出し,クラスタリングを用いて擬似ラベルを生成する。
さらに,本手法では,動的階層型メモリ学習モジュールと情報一貫性進化学習モジュールの2つのコアモジュールが組み込まれている。
動的階層型メモリ学習モジュールは、短期記憶と長期記憶を組み合わせて、ビュー内特徴の一貫性と識別性を高める。
一方、情報整合性進化学習モジュールは、近辺駆動の動的制約機構を活用し、暗黙的なクロスビューセマンティック相関を体系的にキャプチャし、クロスビュー特徴アライメントを改善する。
さらに、自己監督訓練プロセスの安定化・強化を図るため、疑似ラベル強化戦略を導入し、疑似監督の質を向上する。
提案手法は, 自己教師付き設定の下で, クロスビュー特徴表現空間を統一的に構成する。
3つの公開ベンチマークデータセットに対する大規模な実験は、提案手法が既存の自己監督手法を一貫して上回り、最先端監督手法を超越していることを示している。
私たちのコードはhttps://github.com/ISChenawei/DMNILで利用可能です。
関連論文リスト
- Precise GPS-Denied UAV Self-Positioning via Context-Enhanced Cross-View Geo-Localization [10.429391988135345]
本研究では,UAV自己配置タスクに特化して設計されたCEUSPのコンテキスト拡張手法を提案する。
CEUSPは、動的サンプリング戦略(DSS)を統合して、最適な負のサンプルを効率的に選択する一方、RubikのCube Attention(RCA)モジュールは、Context-Aware Channel Integration(CACI)モジュールと組み合わせて、特徴表現と識別を強化する。
本手法は,都市密集環境に特化して設計されたDenseUAVデータセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2025-02-17T03:49:18Z) - SaliencyI2PLoc: saliency-guided image-point cloud localization using contrastive learning [17.29563451509921]
SaliencyI2PLocは、Saliencyマップを機能集約に融合させる、対照的な学習アーキテクチャである。
本手法は,都市シナリオ評価データセット上で78.92%のRecall@1と97.59%のRecall@20を実現する。
論文 参考訳(メタデータ) (2024-12-20T05:20:10Z) - Into the Unknown: Generating Geospatial Descriptions for New Environments [18.736071151303726]
レンデブー課題は、同心空間関係の推論を必要とする。
座標と組み合わせたオープンソース記述(例えばウィキペディア)を使用することで、トレーニングデータを提供するが、空間指向の限られたテキストに悩まされる。
新しい環境のための高品質な合成データを生成するための大規模拡張手法を提案する。
論文 参考訳(メタデータ) (2024-06-28T14:56:21Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - BEVBert: Multimodal Map Pre-training for Language-guided Navigation [75.23388288113817]
視覚・言語ナビゲーション(VLN)における空間認識型マップベース事前学習パラダイムを提案する。
我々は,グローバルなトポロジカルマップにおけるナビゲーション依存性をモデル化しながら,不完全な観測を明示的に集約し,重複を取り除くための局所距離マップを構築した。
ハイブリッドマップをベースとして,マルチモーダルマップ表現を学習するための事前学習フレームワークを考案し,空間認識型クロスモーダル推論を強化し,言語誘導ナビゲーションの目標を導出する。
論文 参考訳(メタデータ) (2022-12-08T16:27:54Z) - Co-visual pattern augmented generative transformer learning for
automobile geo-localization [12.449657263683337]
クロスビュージオローカライゼーション(CVGL)は、地上カメラの地理的位置を、巨大なジオタグ付き空中画像とマッチングすることによって推定することを目的としている。
CVGLのための相互生成型トランスフォーマー学習(MGTL)という,トランスフォーマーと組み合わせたクロスビュー知識生成技術を用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-17T07:29:02Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach [93.67588414950656]
本稿では,無人航空機(UAV)による3D環境におけるIoT(Internet-of-Things)システムについて検討する。
本稿では,TD3-TDCTMアルゴリズムの完成時間最小化のためのトラジェクトリ設計を提案する。
シミュレーションの結果,従来の3つの非学習ベースライン法よりもTD3-TDCTMアルゴリズムの方が優れていることが示された。
論文 参考訳(メタデータ) (2021-07-23T03:33:29Z) - Multiple Object Tracking with Correlation Learning [16.959379957515974]
本研究では,局所相関モジュールを用いて,対象と周辺環境のトポロジカルな関係をモデル化する。
具体的には,各空間の位置とその文脈の密接な対応を確立し,自己教師付き学習を通じて相関量を明確に制約する。
提案手法は, 相関学習と優れた性能の相関学習の有効性を示し, MOT17では76.5%, IDF1では73.6%の最先端MOTAが得られる。
論文 参考訳(メタデータ) (2021-04-08T06:48:02Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。