論文の概要: Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization
- arxiv url: http://arxiv.org/abs/2008.11646v3
- Date: Sun, 6 Jun 2021 02:46:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 21:10:55.271662
- Title: Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization
- Title(参考訳): それぞれの部分: 地域パターンが地理的局所化を促進する
- Authors: Tingyu Wang, Zhedong Zheng, Chenggang Yan, Jiyong Zhang, Yaoqi Sun,
Bolun Zheng, and Yi Yang
- Abstract要約: クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
- 参考スコア(独自算出の注目度): 54.00111565818903
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-view geo-localization is to spot images of the same geographic target
from different platforms, e.g., drone-view cameras and satellites. It is
challenging in the large visual appearance changes caused by extreme viewpoint
variations. Existing methods usually concentrate on mining the fine-grained
feature of the geographic target in the image center, but underestimate the
contextual information in neighbor areas. In this work, we argue that neighbor
areas can be leveraged as auxiliary information, enriching discriminative clues
for geolocalization. Specifically, we introduce a simple and effective deep
neural network, called Local Pattern Network (LPN), to take advantage of
contextual information in an end-to-end manner. Without using extra part
estimators, LPN adopts a square-ring feature partition strategy, which provides
the attention according to the distance to the image center. It eases the part
matching and enables the part-wise representation learning. Owing to the
square-ring partition design, the proposed LPN has good scalability to rotation
variations and achieves competitive results on three prevailing benchmarks,
i.e., University-1652, CVUSA and CVACT. Besides, we also show the proposed LPN
can be easily embedded into other frameworks to further boost performance.
- Abstract(参考訳): クロスビュージオローカライゼーション(クロスビュージオローカライゼーション)とは、異なるプラットフォーム、例えばドローンビューカメラや衛星から同じ地理的ターゲットの画像を見つけることである。
極端な視点の変化による大きな視覚的外見の変化は困難である。
既存の手法は通常、画像センタ内の地理的ターゲットの細かな特徴をマイニングすることに集中するが、隣接する地域の文脈情報を過小評価する。
本研究では,隣接領域を補助情報として活用し,地理的局所化のための識別的手がかりを豊かにすることを提案する。
具体的には,エンド・ツー・エンドでコンテキスト情報を活用するために,ローカルパターンネットワーク(lpn)と呼ばれる,シンプルで効果的なディープニューラルネットワークを導入する。
余分な部分推定器を使わずに、LPNは、画像中心への距離に応じて注意を与える正方形リング特徴分割戦略を採用する。
パートマッチングが簡単になり、パートワイドな表現学習が可能になる。
正方形リング分割設計のため、提案したLPNは回転変動に優れたスケーラビリティを有し、University-1652、CVUSA、CVACTの3つの主要なベンチマークで競合する結果が得られる。
さらに,提案するLPNを他のフレームワークに簡単に組み込むことで,パフォーマンスをさらに向上できることを示す。
関連論文リスト
- Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Adaptively Enhancing Facial Expression Crucial Regions via Local
Non-Local Joint Network [37.665344656227624]
表情認識の特徴学習において, 顔重要領域を適応的に照らすために, 局所的非局所関節ネットワークを提案する。
提案手法は,5つのベンチマークデータセット上での最先端手法と比較して,より競争力のある性能を実現する。
論文 参考訳(メタデータ) (2022-03-26T10:58:25Z) - A Transformer-Based Feature Segmentation and Region Alignment Method For
UAV-View Geo-Localization [0.5257115841810257]
クロスビュージオローカライゼーションは、異なるビューから同じ地理的イメージをマッチングするタスクである。
既存の手法は主により詳細な情報を掘り下げることを目的としている。
本稿では,FSRA(Feature and Region Alignment)と呼ばれる簡易かつ効率的なトランスフォーマーベース構造を導入し,文脈情報を理解する能力を向上させる。
論文 参考訳(メタデータ) (2022-01-23T08:01:42Z) - DenseGAP: Graph-Structured Dense Correspondence Learning with Anchor
Points [15.953570826460869]
2つの画像間の密接な対応を確立することは、基本的なコンピュータビジョンの問題である。
我々は、アンカーポイントに条件付きグラフ構造化ニューラルネットワークを用いたDense対応学習のための新しいソリューションであるDenseGAPを紹介する。
提案手法は,ほとんどのベンチマークにおいて対応学習の最先端化を図っている。
論文 参考訳(メタデータ) (2021-12-13T18:59:30Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。