論文の概要: Self-Supervised Feature Learning for Long-Term Metric Visual
Localization
- arxiv url: http://arxiv.org/abs/2212.00122v1
- Date: Wed, 30 Nov 2022 21:15:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 16:56:42.389678
- Title: Self-Supervised Feature Learning for Long-Term Metric Visual
Localization
- Title(参考訳): 長期視定位のための自己教師付き特徴学習
- Authors: Yuxuan Chen, Timothy D. Barfoot
- Abstract要約: 本稿では,メトリクスの視覚的ローカライゼーションのための新しい自己教師型特徴学習フレームワークを提案する。
提案手法は, 画像照合アルゴリズムを用いて, 基底構造ラベルを使わずに画像対応を生成する。
次に、画像ペアをサンプリングして、深層ニューラルネットワークをトレーニングし、関連する記述子とスコアのスパースな特徴を学習する。
- 参考スコア(独自算出の注目度): 16.987148593917905
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual localization is the task of estimating camera pose in a known scene,
which is an essential problem in robotics and computer vision. However,
long-term visual localization is still a challenge due to the environmental
appearance changes caused by lighting and seasons. While techniques exist to
address appearance changes using neural networks, these methods typically
require ground-truth pose information to generate accurate image
correspondences or act as a supervisory signal during training. In this paper,
we present a novel self-supervised feature learning framework for metric visual
localization. We use a sequence-based image matching algorithm across different
sequences of images (i.e., experiences) to generate image correspondences
without ground-truth labels. We can then sample image pairs to train a deep
neural network that learns sparse features with associated descriptors and
scores without ground-truth pose supervision. The learned features can be used
together with a classical pose estimator for visual stereo localization. We
validate the learned features by integrating with an existing Visual Teach &
Repeat pipeline to perform closed-loop localization experiments under different
lighting conditions for a total of 22.4 km.
- Abstract(参考訳): 視覚的ローカライゼーションは、既知のシーンでカメラのポーズを推定するタスクであり、ロボット工学やコンピュータビジョンにおいて重要な問題である。
しかし、照明や季節による環境変化のため、長期的な視覚的位置決めは依然として課題である。
ニューラルネットワークを用いた外観変化に対処する技術はあるが、これらの手法は訓練中に正確な画像対応を生成するために地上の真実のポーズ情報を必要とする。
本稿では,メトリック・ビジュアル・ローカライゼーションのための自己教師付き特徴学習フレームワークを提案する。
異なる画像列(すなわち経験)にまたがるシーケンスベースの画像マッチングアルゴリズムを用いて、接地ラベルを使わずに画像対応を生成する。
次に、画像ペアをサンプリングして、深層ニューラルネットワークをトレーニングし、関連する記述子とスコアのスパースな特徴を学習する。
学習した特徴は、視覚ステレオローカライゼーションのための古典的なポーズ推定器と併用することができる。
既存のVisual Teach & Repeatパイプラインと統合して,照明条件の異なる閉ループ局所化実験を合計22.4kmで行うことにより,学習機能を検証する。
関連論文リスト
- Context-Based Visual-Language Place Recognition [4.737519767218666]
視覚に基づく位置認識に対する一般的なアプローチは、低レベルの視覚的特徴に依存している。
シーン変更に対して堅牢で,追加のトレーニングを必要としない,新しいVPRアプローチを導入する。
ゼロショット・言語駆動セマンティックセグメンテーションモデルを用いて画素レベルの埋め込みを抽出し,セマンティックイメージ記述子を構築する。
論文 参考訳(メタデータ) (2024-10-25T06:59:11Z) - Self-supervised Learning of Neural Implicit Feature Fields for Camera Pose Refinement [32.335953514942474]
本稿では,3次元の高密度特徴場と2次元の特徴抽出器を併用してシーン表現を共同学習することを提案する。
暗黙の場に符号化された中間的幾何情報を活用するために、ボリュームレンダリングを通してシーンの基盤となる幾何学を学習し、特徴体を設計する。
次に、画像ベースの機能とレンダリングされたボリューム機能を調整することで、視覚的なローカライゼーションを実現する。
論文 参考訳(メタデータ) (2024-06-12T17:51:53Z) - CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition [73.51329037954866]
視覚的位置認識のための画像間相関認識を用いたロバストなグローバル表現手法を提案する。
本手法では,バッチ内の複数の画像の相関にアテンション機構を用いる。
本手法は,訓練時間を大幅に短縮し,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-29T15:05:11Z) - Weatherproofing Retrieval for Localization with Generative AI and
Geometric Consistency [32.46493952272438]
最先端のビジュアルローカライゼーションアプローチは、最初の画像検索ステップに依存している。
我々は、この検索手順を改善し、最終ローカライゼーションタスクに調整する。
これらの変化が、最も困難な視覚的ローカライゼーションデータセットの大幅な改善に変換されることを実験的に示す。
論文 参考訳(メタデータ) (2024-02-14T15:24:20Z) - Neural Radiance Transfer Fields for Relightable Novel-view Synthesis
with Global Illumination [63.992213016011235]
本稿では,ニューラル計算された放射光伝達関数を学習し,新しい視点下でのシーンリライティング手法を提案する。
本手法は,1つの未知の照明条件下で,シーンの実際の画像に対してのみ監視することができる。
その結果, シーンパラメータのアンタングルの復元は, 現状よりも有意に向上していることがわかった。
論文 参考訳(メタデータ) (2022-07-27T16:07:48Z) - Neural Groundplans: Persistent Neural Scene Representations from a
Single Image [90.04272671464238]
本稿では,シーンの2次元画像観察を永続的な3次元シーン表現にマッピングする手法を提案する。
本稿では,永続的でメモリ効率のよいシーン表現として,条件付きニューラルグラウンドプランを提案する。
論文 参考訳(メタデータ) (2022-07-22T17:41:24Z) - Continual Learning for Image-Based Camera Localization [14.47046413243358]
連続学習環境における視覚的局所化の問題について検討する。
以上の結果から,非定常データも分類領域と同様,深層ネットワークにおいて視覚的局所化のための破滅的な忘れを生じさせることが示された。
本稿では,バッファリングプロセスにおける既存のサンプリング戦略を視覚的ローカライゼーションの問題に適応させる,カバレッジスコア(Buff-CS)に基づく新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2021-08-20T11:18:05Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。