論文の概要: SDPL: Shifting-Dense Partition Learning for UAV-View Geo-Localization
- arxiv url: http://arxiv.org/abs/2403.04172v1
- Date: Thu, 7 Mar 2024 03:07:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 15:25:14.888520
- Title: SDPL: Shifting-Dense Partition Learning for UAV-View Geo-Localization
- Title(参考訳): SDPL:UAV-Viewジオローカライゼーションのためのシフト-ディエンス分割学習
- Authors: Quan Chen and Tingyu Wang and Zihao Yang and Haoran Li and Rongfeng Lu
and Yaoqi Sun and Bolun Zheng and Chenggang Yan
- Abstract要約: クロスビュージオローカライゼーションは、例えばドローンや衛星など、異なるプラットフォームから同じターゲットの画像とマッチングすることを目的としている。
既存の手法は主に特徴マップのセグメンテーションを通してより包括的な情報を掘り下げることに焦点を当てている。
シフト・デンス分割学習(Shifting-dense partition learning)と呼ばれる,シンプルだが効果的な部分ベース表現学習を導入する。
- 参考スコア(独自算出の注目度): 28.300443061440955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-view geo-localization aims to match images of the same target from
different platforms, e.g., drone and satellite. It is a challenging task due to
the changing both appearance of targets and environmental content from
different views. Existing methods mainly focus on digging more comprehensive
information through feature maps segmentation, while inevitably destroy the
image structure and are sensitive to the shifting and scale of the target in
the query. To address the above issues, we introduce a simple yet effective
part-based representation learning, called shifting-dense partition learning
(SDPL). Specifically, we propose the dense partition strategy (DPS), which
divides the image into multiple parts to explore contextual-information while
explicitly maintain the global structure. To handle scenarios with non-centered
targets, we further propose the shifting-fusion strategy, which generates
multiple sets of parts in parallel based on various segmentation centers and
then adaptively fuses all features to select the best partitions. Extensive
experiments show that our SDPL is robust to position shifting and scale
variations, and achieves competitive performance on two prevailing benchmarks,
i.e., University-1652 and SUES-200.
- Abstract(参考訳): クロスビュージオローカライゼーションは、例えばドローンや衛星など、異なるプラットフォームから同じターゲットの画像とマッチングすることを目的としている。
異なる視点から対象の外観と環境内容が変化するため、これは困難な課題である。
既存の手法は主に特徴マップのセグメンテーションを通じてより包括的な情報を掘り下げることに重点を置いているが、画像構造を必然的に破壊し、クエリにおけるターゲットのシフトとスケールに敏感である。
上記の課題に対処するために,シフト・デンス分割学習 (SDPL) と呼ばれる,シンプルだが効果的な部分ベース表現学習を導入する。
具体的には,画像を複数の部分に分けて文脈情報を探索し,グローバル構造を明示的に維持する,高密度分割戦略(dps)を提案する。
様々なセグメンテーションセンタに基づいて複数の部品セットを並列に生成し、すべての機能を適応的に融合して最適なパーティションを選択するシフト・フュージョン戦略を提案する。
拡張実験の結果,SDPLは位置ずれやスケールのばらつきに頑健であり,University-1652 と SUES-200 の2つのベンチマークで競合性能を達成できた。
関連論文リスト
- De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Progressively Dual Prior Guided Few-shot Semantic Segmentation [57.37506990980975]
Few-shotのセマンティックセマンティックセマンティクスタスクは、いくつかのアノテーション付きサポートサンプルを使用して、クエリイメージのセマンティクスを実行することを目的としている。
本稿では,先進的に2重にガイドされた数発のセマンティックセマンティックセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2022-11-20T16:19:47Z) - OS-MSL: One Stage Multimodal Sequential Link Framework for Scene
Segmentation and Classification [11.707994658605546]
本稿では,2つの意味論を識別し,活用するための汎用1段マルチモーダルシーケンスリンクフレームワーク(OS-MSL)を提案する。
我々はDiffCorrNetと呼ばれる特定のモジュールを調整し、ショット間の差分や相関関係の情報を明示的に抽出する。
論文 参考訳(メタデータ) (2022-07-04T07:59:34Z) - Integrative Few-Shot Learning for Classification and Segmentation [37.50821005917126]
少数ショット分類とセグメンテーション(FS-CS)の統合タスクについて紹介する。
FS-CSは、ターゲットクラスがいくつかの例で与えられるとき、クエリイメージでターゲットオブジェクトを分類し、セグメントすることを目的としている。
本稿では,FS-CSのための統合的数ショット学習フレームワークを提案し,学習者がクラスワイドな前景マップを構築するように訓練する。
論文 参考訳(メタデータ) (2022-03-29T16:14:40Z) - A Unified Transformer Framework for Group-based Segmentation:
Co-Segmentation, Co-Saliency Detection and Video Salient Object Detection [59.21990697929617]
人間は、ダイナミックな世界に住んでいるので、画像のグループやビデオのフレームから学ぶことによってオブジェクトをマイニングする傾向があります。
従来のアプローチでは、類似したタスクで異なるネットワークを個別に設計するが、互いに適用するのは困難である。
UFO(UnifiedObject Framework for Co-Object Framework)という,これらの問題に対処するための統一フレームワークを導入する。
論文 参考訳(メタデータ) (2022-03-09T13:35:19Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - A Transformer-Based Feature Segmentation and Region Alignment Method For
UAV-View Geo-Localization [0.5257115841810257]
クロスビュージオローカライゼーションは、異なるビューから同じ地理的イメージをマッチングするタスクである。
既存の手法は主により詳細な情報を掘り下げることを目的としている。
本稿では,FSRA(Feature and Region Alignment)と呼ばれる簡易かつ効率的なトランスフォーマーベース構造を導入し,文脈情報を理解する能力を向上させる。
論文 参考訳(メタデータ) (2022-01-23T08:01:42Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。