論文の概要: SDPL: Shifting-Dense Partition Learning for UAV-View Geo-Localization
- arxiv url: http://arxiv.org/abs/2403.04172v1
- Date: Thu, 7 Mar 2024 03:07:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 15:25:14.888520
- Title: SDPL: Shifting-Dense Partition Learning for UAV-View Geo-Localization
- Title(参考訳): SDPL:UAV-Viewジオローカライゼーションのためのシフト-ディエンス分割学習
- Authors: Quan Chen and Tingyu Wang and Zihao Yang and Haoran Li and Rongfeng Lu
and Yaoqi Sun and Bolun Zheng and Chenggang Yan
- Abstract要約: クロスビュージオローカライゼーションは、例えばドローンや衛星など、異なるプラットフォームから同じターゲットの画像とマッチングすることを目的としている。
既存の手法は主に特徴マップのセグメンテーションを通してより包括的な情報を掘り下げることに焦点を当てている。
シフト・デンス分割学習(Shifting-dense partition learning)と呼ばれる,シンプルだが効果的な部分ベース表現学習を導入する。
- 参考スコア(独自算出の注目度): 28.300443061440955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-view geo-localization aims to match images of the same target from
different platforms, e.g., drone and satellite. It is a challenging task due to
the changing both appearance of targets and environmental content from
different views. Existing methods mainly focus on digging more comprehensive
information through feature maps segmentation, while inevitably destroy the
image structure and are sensitive to the shifting and scale of the target in
the query. To address the above issues, we introduce a simple yet effective
part-based representation learning, called shifting-dense partition learning
(SDPL). Specifically, we propose the dense partition strategy (DPS), which
divides the image into multiple parts to explore contextual-information while
explicitly maintain the global structure. To handle scenarios with non-centered
targets, we further propose the shifting-fusion strategy, which generates
multiple sets of parts in parallel based on various segmentation centers and
then adaptively fuses all features to select the best partitions. Extensive
experiments show that our SDPL is robust to position shifting and scale
variations, and achieves competitive performance on two prevailing benchmarks,
i.e., University-1652 and SUES-200.
- Abstract(参考訳): クロスビュージオローカライゼーションは、例えばドローンや衛星など、異なるプラットフォームから同じターゲットの画像とマッチングすることを目的としている。
異なる視点から対象の外観と環境内容が変化するため、これは困難な課題である。
既存の手法は主に特徴マップのセグメンテーションを通じてより包括的な情報を掘り下げることに重点を置いているが、画像構造を必然的に破壊し、クエリにおけるターゲットのシフトとスケールに敏感である。
上記の課題に対処するために,シフト・デンス分割学習 (SDPL) と呼ばれる,シンプルだが効果的な部分ベース表現学習を導入する。
具体的には,画像を複数の部分に分けて文脈情報を探索し,グローバル構造を明示的に維持する,高密度分割戦略(dps)を提案する。
様々なセグメンテーションセンタに基づいて複数の部品セットを並列に生成し、すべての機能を適応的に融合して最適なパーティションを選択するシフト・フュージョン戦略を提案する。
拡張実験の結果,SDPLは位置ずれやスケールのばらつきに頑健であり,University-1652 と SUES-200 の2つのベンチマークで競合性能を達成できた。
関連論文リスト
- A Transformer-Based Adaptive Semantic Aggregation Method for UAV Visual
Geo-Localization [2.1462492411694756]
本稿では,無人航空機(UAV)の視覚的ジオローカライゼーションの課題について述べる。
部分レベルの表現は、画像の詳細をキャプチャし、シーンの意味情報を理解するのに役立つため、UAVの視覚的ジオローカライゼーションには、パートマッチングが不可欠である。
画像中の最も代表的な意味論として部品を考慮に入れた変換器に基づく適応的意味的アグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2024-01-03T06:58:52Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Image as Set of Points [60.30495338399321]
コンテキストクラスタ(CoC)は、イメージを非組織的なポイントの集合と見なし、単純化されたクラスタリングアルゴリズムによって特徴を抽出する。
われわれのCoCは畳み込みと無注意で、空間的相互作用のためのクラスタリングアルゴリズムにのみ依存している。
論文 参考訳(メタデータ) (2023-03-02T18:56:39Z) - Simple, Effective and General: A New Backbone for Cross-view Image
Geo-localization [9.687328460113832]
我々は、シンプルな注意に基づく画像ジオローカライゼーションネットワーク(SAIG)という新しいバックボーンネットワークを提案する。
提案したSAIGは、パッチ間の長距離相互作用と、マルチヘッド・セルフアテンション・レイヤとのクロスビュー対応を効果的に表現する。
我々のSAIGは、従来よりもはるかにシンプルでありながら、クロスビューなジオローカライゼーションにおける最先端の成果を達成している。
論文 参考訳(メタデータ) (2023-02-03T06:50:51Z) - Self-Training Guided Disentangled Adaptation for Cross-Domain Remote
Sensing Image Semantic Segmentation [20.07907723950031]
本稿では,クロスドメインRS画像セマンティックセグメンテーションタスクのための自己学習ガイド型不整合適応ネットワーク(ST-DASegNet)を提案する。
まず,ソースとターゲットの両方のイメージに対して,ソーススタイルとターゲットスタイルの特徴をそれぞれ抽出するために,ソース学生のバックボーンとターゲット学生のバックボーンを提案する。
次に、ユニバーサルな特徴を抽出し、ソーススタイルとターゲットスタイルの特徴の異なる特徴を浄化するために、ドメイン非絡み合いモジュールを提案する。
論文 参考訳(メタデータ) (2023-01-13T13:11:22Z) - Vision Transformers: From Semantic Segmentation to Dense Prediction [139.15562023284187]
視覚的予測のための視覚変換器(ViT)のグローバルな文脈学習の可能性について検討する。
我々のモチベーションは、グローバルコンテキストを全受容界層で学習することで、ViTがより強力な長距離依存性情報を取得することである。
階層型ローカル・グローバル・トランスフォーマー (HLG) のファミリを定式化し, 窓内部の局所的な注意と, ピラミッド建築における窓全体のグローバルアテンションを特徴とする。
論文 参考訳(メタデータ) (2022-07-19T15:49:35Z) - A Unified Transformer Framework for Group-based Segmentation:
Co-Segmentation, Co-Saliency Detection and Video Salient Object Detection [59.21990697929617]
人間は、ダイナミックな世界に住んでいるので、画像のグループやビデオのフレームから学ぶことによってオブジェクトをマイニングする傾向があります。
従来のアプローチでは、類似したタスクで異なるネットワークを個別に設計するが、互いに適用するのは困難である。
UFO(UnifiedObject Framework for Co-Object Framework)という,これらの問題に対処するための統一フレームワークを導入する。
論文 参考訳(メタデータ) (2022-03-09T13:35:19Z) - A Transformer-Based Feature Segmentation and Region Alignment Method For
UAV-View Geo-Localization [0.5257115841810257]
クロスビュージオローカライゼーションは、異なるビューから同じ地理的イメージをマッチングするタスクである。
既存の手法は主により詳細な情報を掘り下げることを目的としている。
本稿では,FSRA(Feature and Region Alignment)と呼ばれる簡易かつ効率的なトランスフォーマーベース構造を導入し,文脈情報を理解する能力を向上させる。
論文 参考訳(メタデータ) (2022-01-23T08:01:42Z) - Remote Sensing Images Semantic Segmentation with General Remote Sensing
Vision Model via a Self-Supervised Contrastive Learning Method [13.479068312825781]
リモートセマンティックセグメンテーションのためのGlobal style and Local matching Contrastive Learning Network (GLCNet)を提案する。
具体的には、画像レベルの表現をより良く学習するために、グローバルスタイルのコントラストモジュールが使用される。
コントラストモジュールにマッチするローカル特徴は、セマンティックセグメンテーションに有用なローカル領域の表現を学習するために設計されている。
論文 参考訳(メタデータ) (2021-06-20T03:03:40Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。