論文の概要: Visual Geo-localization with Self-supervised Representation Learning
- arxiv url: http://arxiv.org/abs/2308.00090v1
- Date: Mon, 31 Jul 2023 19:03:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 16:29:25.433545
- Title: Visual Geo-localization with Self-supervised Representation Learning
- Title(参考訳): 自己教師付き表現学習による視覚局所化
- Authors: Jiuhong Xiao, Gao Zhu and Giuseppe Loianno
- Abstract要約: 大規模なビジュアルジオローカライゼーションデータセットの性能向上とトレーニングの効率化を目的として,新しい統合VG-SSLフレームワークを提案する。
我々の作業には、VG用に調整された複数のSSLメソッド、SimCLR、MoCov2、BYOL、SimSiam、Barlow Twins、VICRegが組み込まれています。
- 参考スコア(独自算出の注目度): 4.368278673602595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Geo-localization (VG) has emerged as a significant research area,
aiming to identify geolocation based on visual features. Most VG approaches use
learnable feature extractors for representation learning. Recently,
Self-Supervised Learning (SSL) methods have also demonstrated comparable
performance to supervised methods by using numerous unlabeled images for
representation learning. In this work, we present a novel unified VG-SSL
framework with the goal to enhance performance and training efficiency on a
large VG dataset by SSL methods. Our work incorporates multiple SSL methods
tailored for VG: SimCLR, MoCov2, BYOL, SimSiam, Barlow Twins, and VICReg. We
systematically analyze the performance of different training strategies and
study the optimal parameter settings for the adaptation of SSL methods for the
VG task. The results demonstrate that our method, without the significant
computation and memory usage associated with Hard Negative Mining (HNM), can
match or even surpass the VG performance of the baseline that employs HNM. The
code is available at https://github.com/arplaboratory/VG_SSL.
- Abstract(参考訳): visual geo-localization (vg) が重要な研究領域として登場し、視覚的特徴に基づく位置情報の特定を目指している。
ほとんどのVGアプローチは、表現学習に学習可能な特徴抽出器を使用する。
近年,自己監視学習(SSL)手法は,多数の未ラベル画像を用いて教師付き手法に匹敵する性能を示した。
本研究では,SSL方式による大規模VGデータセットの性能向上とトレーニングの効率化を目的とした,新しい統合VG-SSLフレームワークを提案する。
我々の作業には、VG用に調整された複数のSSLメソッド、SimCLR、MoCov2、BYOL、SimSiam、Barlow Twins、VICRegが組み込まれています。
本稿では,異なるトレーニング戦略の性能を体系的に分析し,VGタスクに対するSSLメソッドの適応のための最適パラメータ設定について検討する。
その結果,HNM(Hard Negative Mining)に付随する計算量やメモリ使用量を用いなくても,HNMを用いたベースラインのVG性能にマッチしたり,超えたりできることがわかった。
コードはhttps://github.com/arplaboratory/vg_sslで入手できる。
関連論文リスト
- A Closer Look at Benchmarking Self-Supervised Pre-training with Image Classification [51.35500308126506]
自己教師付き学習(SSL)は、データ自体が監視を提供する機械学習アプローチであり、外部ラベルの必要性を排除している。
SSLの分類に基づく評価プロトコルがどのように相関し、異なるデータセットのダウンストリーム性能を予測するかを検討する。
論文 参考訳(メタデータ) (2024-07-16T23:17:36Z) - GSLB: The Graph Structure Learning Benchmark [34.859275408785614]
グラフ構造学習(GSL)は、グラフニューラルネットワーク(GNN)のパラメータと計算グラフ構造の両方を同時に最適化する能力のため、近年注目されている。
パフォーマンス評価の標準的な実験的な設定や公正な比較は存在せず、この分野の進歩を理解するのに大きな障害を生み出します。
グラフ構造学習ベンチマーク (GSLB) を開発した。
論文 参考訳(メタデータ) (2023-10-08T14:13:03Z) - MOCA: Self-supervised Representation Learning by Predicting Masked Online Codebook Assignments [72.6405488990753]
自己教師付き学習は、ビジョントランスフォーマーネットワークの欲求を軽減できる。
所望のプロパティを統一する単段および単段のMOCAを提案する。
我々は,様々な評価プロトコルにおいて,低照度設定と強力な実験結果に対して,最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-07-18T15:46:20Z) - Simultaneous or Sequential Training? How Speech Representations
Cooperate in a Multi-Task Self-Supervised Learning System [12.704529528199064]
最近の研究は、表現学習のための自己教師付き学習(SSL)と視覚接地音声(VGS)処理機構を組み合わせたものである。
マルチタスク学習システムとして,wav2vec 2.0ベースのSSLとトランスフォーマーベースのVGSの協調最適化について検討した。
論文 参考訳(メタデータ) (2023-06-05T15:35:19Z) - On the Transferability of Visual Features in Generalized Zero-Shot
Learning [28.120004119724577]
Generalized Zero-Shot Learning (GZSL) は、目に見えないクラスに一般化可能な分類器を訓練することを目的としている。
本研究では,異なる特徴抽出器を用いた場合のGZSL法の有用性について検討する。
また、これらのモデルの事前学習目標、データセット、アーキテクチャ設計が特徴表現能力にどのように影響するかについても検討する。
論文 参考訳(メタデータ) (2022-11-22T18:59:09Z) - Improving Self-Supervised Learning by Characterizing Idealized
Representations [155.1457170539049]
与えられたデータ拡張に不変なタスクに対して必要かつ十分な条件を証明します。
対照的に、我々のフレームワークは、従来の手法に対して単純だが重要な改善を規定している。
非コントラスト学習では、私たちのフレームワークを使って、シンプルで斬新な目的を導き出します。
論文 参考訳(メタデータ) (2022-09-13T18:01:03Z) - Industry Scale Semi-Supervised Learning for Natural Language
Understanding [14.844450283047234]
本論文では,学生教師フレームワークに基づく半教師学習(SSL)パイプラインについて述べる。
実運用におけるSSLコンテキストにおけるラベルなしデータの使用に関する2つの質問について検討する。
Pseudo-Label (PL), Knowledge Distillation (KD), Virtual Adversarial Training (VAT), Cross-View Training (CVT)の4つのSSL技術を比較します。
論文 参考訳(メタデータ) (2021-03-29T18:24:02Z) - Graph-based Semi-supervised Learning: A Comprehensive Review [51.26862262550445]
半教師付き学習(ssl)はラベル付きデータとラベルなしデータの両方を利用する能力があるため、実際非常に価値があります。
重要なSSLメソッドのクラスは、グラフベースの半教師付き学習(GSSL)メソッドに対応するグラフとしてデータを自然に表現することです。
GSSLメソッドは、構造のユニークさ、アプリケーションの普遍性、大規模データへのスケーラビリティのために、さまざまなドメインでその利点を実証しています。
論文 参考訳(メタデータ) (2021-02-26T05:11:09Z) - Self-Supervised Learning of Graph Neural Networks: A Unified Review [50.71341657322391]
ラベルなしサンプルを多用する新たなパラダイムとして,自己教師型学習が登場している。
SSLを用いたグラフニューラルネットワーク(GNNs)のトレーニング方法の統一レビューを提供します。
gnnに対するssl手法の処理は,様々な手法の類似性と相違に光を当て,新しい手法やアルゴリズムの開発段階を定めている。
論文 参考訳(メタデータ) (2021-02-22T03:43:45Z) - On Data-Augmentation and Consistency-Based Semi-Supervised Learning [77.57285768500225]
最近提案された整合性に基づく半教師付き学習(SSL)手法は,複数のSSLタスクにおいて最先端技術である。
これらの進歩にもかかわらず、これらの手法の理解はまだ比較的限られている。
論文 参考訳(メタデータ) (2021-01-18T10:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。