論文の概要: On the Estimation of Image-matching Uncertainty in Visual Place Recognition
- arxiv url: http://arxiv.org/abs/2404.00546v1
- Date: Sun, 31 Mar 2024 03:24:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 03:10:31.561233
- Title: On the Estimation of Image-matching Uncertainty in Visual Place Recognition
- Title(参考訳): 視覚的位置認識における画像マッチングの不確かさの推定について
- Authors: Mubariz Zaffar, Liangliang Nan, Julian F. P. Kooij,
- Abstract要約: ビジュアルプレース認識(VPR)では、画像と参照画像のマップと既知の参照ポーズとを比較して、クエリ画像のポーズを推定する。
この研究は、画像マッチングの不確実性を推定するための主要なアプローチを初めて比較した。
簡単なベースライン法であるSUE'を定式化し、他の方法と異なり、地図上の参照画像の自由なポーズを考える。
- 参考スコア(独自算出の注目度): 7.769607568805291
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In Visual Place Recognition (VPR) the pose of a query image is estimated by comparing the image to a map of reference images with known reference poses. As is typical for image retrieval problems, a feature extractor maps the query and reference images to a feature space, where a nearest neighbor search is then performed. However, till recently little attention has been given to quantifying the confidence that a retrieved reference image is a correct match. Highly certain but incorrect retrieval can lead to catastrophic failure of VPR-based localization pipelines. This work compares for the first time the main approaches for estimating the image-matching uncertainty, including the traditional retrieval-based uncertainty estimation, more recent data-driven aleatoric uncertainty estimation, and the compute-intensive geometric verification. We further formulate a simple baseline method, ``SUE'', which unlike the other methods considers the freely-available poses of the reference images in the map. Our experiments reveal that a simple L2-distance between the query and reference descriptors is already a better estimate of image-matching uncertainty than current data-driven approaches. SUE outperforms the other efficient uncertainty estimation methods, and its uncertainty estimates complement the computationally expensive geometric verification approach. Future works for uncertainty estimation in VPR should consider the baselines discussed in this work.
- Abstract(参考訳): ビジュアルプレース認識(VPR)では、画像と参照画像のマップと既知の参照ポーズとを比較して、クエリ画像のポーズを推定する。
画像検索の典型的な問題と同様に、特徴抽出器は、クエリと参照画像を特徴空間にマッピングし、隣り合う探索を行う。
しかし、最近まで、検索された参照画像が正しい一致であるという信頼度を定量化するためにはほとんど注意が払われていない。
高精度だが誤った検索は、VPRベースのローカライゼーションパイプラインの破滅的な失敗につながる可能性がある。
この研究は、従来の検索に基づく不確実性推定、より最近のデータ駆動のアレタリック不確実性推定、および計算集約的な幾何的検証を含む、画像マッチングの不確かさを推定するための主要なアプローチを初めて比較した。
さらに,図中の参照画像の自由なポーズを考える他の方法と異なり,簡単なベースライン法である ``SUE'' を定式化する。
実験の結果,クエリと参照記述子間の単純なL2距離は,現在のデータ駆動手法よりも画像マッチングの不確かさを推定できることがわかった。
SUEは他の効率的な不確実性推定法よりも優れており、その不確実性推定は計算に高価な幾何的検証手法を補完する。
VPRにおける不確実性評価のための今後の研究は、この研究で議論されたベースラインを考慮するべきである。
関連論文リスト
- Revisiting Gradient-based Uncertainty for Monocular Depth Estimation [10.502852645001882]
単分子深度推定モデルに対する勾配に基づく不確実性推定を導入する。
我々は,本手法が再トレーニングを伴わずに不確実性を決定するのに有効であることを実証した。
特に、単分子配列で訓練されたモデルにおいて、最も不確実性が高いため、本手法は関連するアプローチよりも優れる。
論文 参考訳(メタデータ) (2025-02-09T17:21:41Z) - Post-hoc Probabilistic Vision-Language Models [51.12284891724463]
視覚言語モデル(VLM)は、分類、検索、生成タスクにおいて顕著な成功を収めている。
追加トレーニングを必要としないVLMにおけるポストホック不確実性評価を提案する。
この結果から,大規模モデルの安全性クリティカルな応用が期待できることがわかった。
論文 参考訳(メタデータ) (2024-12-08T18:16:13Z) - Deep priors for satellite image restoration with accurate uncertainties [4.879530644978008]
本稿では,複数のセンサからの画像を復元する1つのネットワークを包含する汎用手法を提案する。
VBLE-xzは、現実的な後続サンプルと正確な不確実性を得るためのスケーラブルな方法である。
SatDPIRは、不確実性を必要としない場合、直接反転法に代わる魅力的な代替手段である。
論文 参考訳(メタデータ) (2024-12-05T12:56:03Z) - Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - Annotation Cost-Efficient Active Learning for Deep Metric Learning Driven Remote Sensing Image Retrieval [3.2109665109975696]
ANNEALは、類似した、異種のイメージペアで構成された、小さくて情報的なトレーニングセットを作成することを目的としている。
不確実性と多様性の基準を組み合わせることにより、画像対の情報性を評価する。
このアノテート方式は、ランド・ユース・ランド・カバー・クラスラベルによるアノテート画像と比較して、アノテーションコストを著しく削減する。
論文 参考訳(メタデータ) (2024-06-14T15:08:04Z) - Gradient-based Uncertainty for Monocular Depth Estimation [5.7575052885308455]
単眼深度推定では、移動物体や反射材料のような画像コンテキストの乱れは、容易に誤った予測につながる。
本稿では,すでに訓練済みで固定された深度推定モデルに対するポストホック不確実性推定手法を提案する。
提案手法は,ニューラルネットワークの再トレーニングを必要とせずに,KITTI と NYU Depth V2 ベンチマークにおける最先端の不確実性推定結果を実現する。
論文 参考訳(メタデータ) (2022-08-03T12:21:02Z) - NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural
Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。
種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-02-07T12:30:45Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Learning Accurate Dense Correspondences and When to Trust Them [161.76275845530964]
2つの画像に関連する密度の高い流れ場と、堅牢な画素方向の信頼度マップの推定を目指しています。
フロー予測とその不確実性を共同で学習するフレキシブルな確率的アプローチを開発する。
本手法は,幾何学的マッチングと光フローデータセットに挑戦する最新の結果を得る。
論文 参考訳(メタデータ) (2021-01-05T18:54:11Z) - Uncertainty-Aware Few-Shot Image Classification [118.72423376789062]
ラベル付き限られたデータから新しいカテゴリを認識できる画像分類はほとんどない。
画像分類のための不確実性を考慮したFew-Shotフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-09T12:26:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。