論文の概要: Global Proxy-based Hard Mining for Visual Place Recognition
- arxiv url: http://arxiv.org/abs/2302.14217v1
- Date: Tue, 28 Feb 2023 00:43:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 18:31:35.899436
- Title: Global Proxy-based Hard Mining for Visual Place Recognition
- Title(参考訳): 視覚位置認識のためのグローバルプロキシに基づくハードマイニング
- Authors: Amar Ali-bey, Brahim Chaib-draa, Philippe Gigu\`ere
- Abstract要約: 本稿では, プロキシをベースとした世界規模のミニバッチサンプリングを行う手法を提案する。
そのため、ネットワークに新しいエンドツーエンドのトレーニング可能なブランチを追加し、効率的な場所記述子を生成する。
提案手法は,既存の2値損失関数と3値損失関数を組み合わせて,メモリと計算コストの最小化を図り得る。
- 参考スコア(独自算出の注目度): 3.6739949215165164
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning deep representations for visual place recognition is commonly
performed using pairwise or triple loss functions that highly depend on the
hardness of the examples sampled at each training iteration. Existing
techniques address this by using computationally and memory expensive offline
hard mining, which consists of identifying, at each iteration, the hardest
samples from the training set. In this paper we introduce a new technique that
performs global hard mini-batch sampling based on proxies. To do so, we add a
new end-to-end trainable branch to the network, which generates efficient place
descriptors (one proxy for each place). These proxy representations are thus
used to construct a global index that encompasses the similarities between all
places in the dataset, allowing for highly informative mini-batch sampling at
each training iteration. Our method can be used in combination with all
existing pairwise and triplet loss functions with negligible additional memory
and computation cost. We run extensive ablation studies and show that our
technique brings new state-of-the-art performance on multiple large-scale
benchmarks such as Pittsburgh, Mapillary-SLS and SPED. In particular, our
method provides more than 100% relative improvement on the challenging Nordland
dataset. Our code is available at https://github.com/amaralibey/GPM
- Abstract(参考訳): 視覚的な場所認識のための深層表現の学習は、各トレーニングイテレーションでサンプリングされたサンプルの硬度に大きく依存するペアワイズまたはトリプルロス関数を用いて行われる。
既存のテクニックでは、計算とメモリコストのかかるオフラインハードマイニングを使用して、各イテレーションにおいて、トレーニングセットから最も難しいサンプルを特定することで、この問題に対処している。
本稿では, プロキシをベースとした世界規模のミニバッチサンプリングを行う手法を提案する。
そのために、ネットワークに新しいエンドツーエンドのトレーニング可能なブランチを追加し、効率の良い場所記述子(各場所に1つのプロキシ)を生成する。
これらのプロキシ表現は、データセット内のすべての場所間の類似性を包含するグローバルインデックスを構築するために使用され、各トレーニングイテレーションで非常に有益なミニバッチサンプリングを可能にする。
提案手法は,既存の2値損失関数と3値損失関数を組み合わせ,メモリと計算コストを考慮しない。
我々は広範なアブレーション研究を行い,ピッツバーグ,マピラリーsls,spedなどの大規模ベンチマークにおいて,新たな最先端性能をもたらすことを示す。
特に本手法は,難解なnordlandデータセットに対して100%以上の相対的改善を提供する。
私たちのコードはhttps://github.com/amaralibey/GPMで利用可能です。
関連論文リスト
- AANet: Aggregation and Alignment Network with Semi-hard Positive Sample
Mining for Hierarchical Place Recognition [48.043749855085025]
視覚的位置認識(VPR)はロボット工学におけるホットスポットの一つで、視覚情報を用いてロボットの位置を特定する。
本稿では,アグリゲーションモジュールを介して候補を検索するためのグローバルな特徴を抽出できる統一ネットワークを提案する。
また、より堅牢なVPRネットワークをトレーニングするために、適切なハード正のイメージを選択するためのセミハード正のサンプルマイニング(ShPSM)戦略を提案する。
論文 参考訳(メタデータ) (2023-10-08T14:46:11Z) - Multi-Level Contrastive Learning for Dense Prediction Task [59.591755258395594]
本稿では,高密度予測タスクのための領域レベルの特徴表現を効率よく学習するための,MCL(Multi-Level Contrastive Learning for Dense Prediction Task)を提案する。
本手法は, 局所化, スケールの整合性, 認識の3つの要因に動機付けられている。
提案手法は,様々なデータセットにおける最近の最先端の手法よりも有意なマージンを有する。
論文 参考訳(メタデータ) (2023-04-04T17:59:04Z) - A Maximum Log-Likelihood Method for Imbalanced Few-Shot Learning Tasks [3.2895195535353308]
数ショットアーキテクチャのための新しい最大ログ類似度指標を提案する。
提案手法は,従来の類似度指標よりも優れた性能を実現することを示す。
また,提案アルゴリズムは,評価データが不均衡である場合に,最先端のトランスダクティブな数ショット性能を実現することを示す。
論文 参考訳(メタデータ) (2022-11-26T21:31:00Z) - Graph Sampling Based Deep Metric Learning for Generalizable Person
Re-Identification [114.56752624945142]
我々は、最も一般的なランダムサンプリング手法である有名なpkサンプリングは、深層メトリック学習にとって有益で効率的ではないと主張する。
大規模計量学習のためのグラフサンプリング(GS)と呼ばれる効率的なミニバッチサンプリング手法を提案する。
論文 参考訳(メタデータ) (2021-04-04T06:44:15Z) - Learning Intra-Batch Connections for Deep Metric Learning [3.5665681694253903]
メートル法学習は、類似のサンプルが異種よりも近い低次元空間にサンプルをマッピングする関数を学習することを目的としている。
ほとんどのアプローチは、サンプルのペアまたはトリプレット間の関係のみを考慮した損失に依存する。
ミニバッチにおけるすべての関係を考慮に入れたメッセージパッシングネットワークに基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-15T18:50:00Z) - Exploiting Shared Representations for Personalized Federated Learning [54.65133770989836]
本稿では,クライアント間の共有データ表現と,クライアント毎のユニークなローカルヘッダを学習するための,新しいフェデレーション学習フレームワークとアルゴリズムを提案する。
提案アルゴリズムは, クライアント間の分散計算能力を利用して, 表現の更新毎に低次元の局所パラメータに対して, 多数の局所更新を行う。
この結果は、データ分布間の共有低次元表現を学習することを目的とした、幅広い種類の問題に対するフェデレーション学習以上の関心を持っている。
論文 参考訳(メタデータ) (2021-02-14T05:36:25Z) - Fewer is More: A Deep Graph Metric Learning Perspective Using Fewer
Proxies [65.92826041406802]
本稿では,グラフ分類の観点から,プロキシベースのディープグラフメトリックラーニング手法を提案する。
複数のグローバルプロキシを利用して、各クラスの元のデータポイントを総括的に近似する。
本研究では, 近接関係を接地トラス・ラベルに従って調整する, 新たな逆ラベル伝搬アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-10-26T14:52:42Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。