論文の概要: Visual Geo-localization with Self-supervised Representation Learning
- arxiv url: http://arxiv.org/abs/2308.00090v2
- Date: Fri, 15 Sep 2023 20:48:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 22:59:35.696359
- Title: Visual Geo-localization with Self-supervised Representation Learning
- Title(参考訳): 自己教師付き表現学習による視覚局所化
- Authors: Jiuhong Xiao, Gao Zhu and Giuseppe Loianno
- Abstract要約: 大規模なビジュアルジオローカライゼーションデータセットの性能向上とトレーニングの効率化を目的として,新しい統合VG-SSLフレームワークを提案する。
我々の作業には、VG用に調整された複数のSSLメソッド、SimCLR、MoCov2、BYOL、SimSiam、Barlow Twins、VICRegが組み込まれています。
- 参考スコア(独自算出の注目度): 8.642591824865892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Geo-localization (VG) has emerged as a significant research area,
aiming to identify geolocation based on visual features. Most VG approaches use
learnable feature extractors for representation learning. Recently,
Self-Supervised Learning (SSL) methods have also demonstrated comparable
performance to supervised methods by using numerous unlabeled images for
representation learning. In this work, we present a novel unified VG-SSL
framework with the goal to enhance performance and training efficiency on a
large VG dataset by SSL methods. Our work incorporates multiple SSL methods
tailored for VG: SimCLR, MoCov2, BYOL, SimSiam, Barlow Twins, and VICReg. We
systematically analyze the performance of different training strategies and
study the optimal parameter settings for the adaptation of SSL methods for the
VG task. The results demonstrate that our method, without the significant
computation and memory usage associated with Hard Negative Mining (HNM), can
match or even surpass the VG performance of the baseline that employs HNM. The
code is available at https://github.com/arplaboratory/VG_SSL.
- Abstract(参考訳): visual geo-localization (vg) が重要な研究領域として登場し、視覚的特徴に基づく位置情報の特定を目指している。
ほとんどのVGアプローチは、表現学習に学習可能な特徴抽出器を使用する。
近年,自己監視学習(SSL)手法は,多数の未ラベル画像を用いて教師付き手法に匹敵する性能を示した。
本研究では,SSL方式による大規模VGデータセットの性能向上とトレーニングの効率化を目的とした,新しい統合VG-SSLフレームワークを提案する。
我々の作業には、VG用に調整された複数のSSLメソッド、SimCLR、MoCov2、BYOL、SimSiam、Barlow Twins、VICRegが組み込まれています。
本稿では,異なるトレーニング戦略の性能を体系的に分析し,VGタスクに対するSSLメソッドの適応のための最適パラメータ設定について検討する。
その結果,HNM(Hard Negative Mining)に付随する計算量やメモリ使用量を用いなくても,HNMを用いたベースラインのVG性能にマッチしたり,超えたりできることがわかった。
コードはhttps://github.com/arplaboratory/vg_sslで入手できる。
関連論文リスト
- Self-supervised Learning for Geospatial AI: A Survey [21.504978593542354]
自己教師付き学習(SSL)は地理空間データに採用されていることで注目を集めている。
本稿では,地理空間ベクトルデータで広く用いられている3種類の一次データ(幾何学)に対して,SSL技術の適用および開発に関する包括的かつ最新の調査を行う。
論文 参考訳(メタデータ) (2024-08-22T05:28:22Z) - Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - Image-Based Geolocation Using Large Vision-Language Models [19.071551941682063]
画像に基づく位置情報の精度を大幅に向上する革新的なフレームワークであるToolを紹介した。
ツールは体系的なチェーン・オブ・シント(CoT)アプローチを採用し、人間のジオゲスティング戦略を模倣する。
GeoGuessrゲームの平均スコアは4550.5で85.37%で、高精度な位置情報予測を行う。
論文 参考訳(メタデータ) (2024-08-18T13:39:43Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Co-visual pattern augmented generative transformer learning for
automobile geo-localization [12.449657263683337]
クロスビュージオローカライゼーション(CVGL)は、地上カメラの地理的位置を、巨大なジオタグ付き空中画像とマッチングすることによって推定することを目的としている。
CVGLのための相互生成型トランスフォーマー学習(MGTL)という,トランスフォーマーと組み合わせたクロスビュー知識生成技術を用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-17T07:29:02Z) - Graph-based Semi-supervised Learning: A Comprehensive Review [51.26862262550445]
半教師付き学習(ssl)はラベル付きデータとラベルなしデータの両方を利用する能力があるため、実際非常に価値があります。
重要なSSLメソッドのクラスは、グラフベースの半教師付き学習(GSSL)メソッドに対応するグラフとしてデータを自然に表現することです。
GSSLメソッドは、構造のユニークさ、アプリケーションの普遍性、大規模データへのスケーラビリティのために、さまざまなドメインでその利点を実証しています。
論文 参考訳(メタデータ) (2021-02-26T05:11:09Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。