論文の概要: VPR-Bench: An Open-Source Visual Place Recognition Evaluation Framework
with Quantifiable Viewpoint and Appearance Change
- arxiv url: http://arxiv.org/abs/2005.08135v2
- Date: Fri, 1 Oct 2021 18:09:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 05:34:31.711791
- Title: VPR-Bench: An Open-Source Visual Place Recognition Evaluation Framework
with Quantifiable Viewpoint and Appearance Change
- Title(参考訳): VPR-Bench: 定量的視点と外観変化を備えたオープンソースの視覚的位置認識評価フレームワーク
- Authors: Mubariz Zaffar and Sourav Garg and Michael Milford and Julian Kooij
and David Flynn and Klaus McDonald-Maier and Shoaib Ehsan
- Abstract要約: VPRの研究は、カメラハードウェアの改善とディープラーニングベースの技術の可能性により、過去10年間で急速に成長してきた。
この成長は、特に性能評価に関する分野における断片化と標準化の欠如につながった。
本稿では,VPR技術の性能評価を行うオープンソースフレームワーク「VPR-Bench」を通じて,これらのギャップに対処する。
- 参考スコア(独自算出の注目度): 25.853640977526705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Place Recognition (VPR) is the process of recognising a previously
visited place using visual information, often under varying appearance
conditions and viewpoint changes and with computational constraints. VPR is
related to the concepts of localisation, loop closure, image retrieval and is a
critical component of many autonomous navigation systems ranging from
autonomous vehicles to drones and computer vision systems. While the concept of
place recognition has been around for many years, VPR research has grown
rapidly as a field over the past decade due to improving camera hardware and
its potential for deep learning-based techniques, and has become a widely
studied topic in both the computer vision and robotics communities. This growth
however has led to fragmentation and a lack of standardisation in the field,
especially concerning performance evaluation. Moreover, the notion of viewpoint
and illumination invariance of VPR techniques has largely been assessed
qualitatively and hence ambiguously in the past. In this paper, we address
these gaps through a new comprehensive open-source framework for assessing the
performance of VPR techniques, dubbed "VPR-Bench". VPR-Bench (Open-sourced at:
https://github.com/MubarizZaffar/VPR-Bench) introduces two much-needed
capabilities for VPR researchers: firstly, it contains a benchmark of 12
fully-integrated datasets and 10 VPR techniques, and secondly, it integrates a
comprehensive variation-quantified dataset for quantifying viewpoint and
illumination invariance. We apply and analyse popular evaluation metrics for
VPR from both the computer vision and robotics communities, and discuss how
these different metrics complement and/or replace each other, depending upon
the underlying applications and system requirements.
- Abstract(参考訳): 視覚位置認識(英: visual place recognition、vpr)は、視覚情報を用いて、しばしば様々な外観条件や視点の変化や計算上の制約の下で、以前訪れた場所を認識する過程である。
vprは、ローカライズ、ループクロージャ、画像検索の概念と関連しており、自動運転車からドローン、コンピュータビジョンシステムまで、多くの自律ナビゲーションシステムの重要な要素である。
場所認識の概念は長年にわたって存在してきたが、カメラハードウェアの改良とディープラーニング技術の可能性により、VPRの研究はここ10年間で急速に成長し、コンピュータビジョンとロボティクスのコミュニティの両方で広く研究されている。
しかし、この成長は、特に性能評価に関する分野での断片化と標準化の欠如につながった。
さらに、vpr技術の視点と照明不変性の概念は、過去には質的かつ曖昧に評価されてきた。
本稿では,VPR技術の性能を評価するためのオープンソースフレームワーク「VPR-Bench」を通じて,これらのギャップに対処する。
VPR-Bench(オープンソース:https://github.com/MubarizZaffar/VPR-Bench)は、VPR研究者に最も必要とされている2つの機能を紹介している。
コンピュータビジョンとロボティクスの両コミュニティから、VPRの一般的な評価基準を適用し、分析し、基礎となるアプリケーションやシステム要件に応じて、これらのメトリクスが相互に補完し、置き換える方法について論じる。
関連論文リスト
- Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - A-MuSIC: An Adaptive Ensemble System For Visual Place Recognition In
Changing Environments [22.58641358408613]
視覚的位置認識(VPR)は、ロボットナビゲーションとローカライゼーションシステムにおいて不可欠な要素である。
すべての環境条件において、単一のVPR技術が優れているわけではない。
A-MuSIC(Adaptive Multi-Self Identification and Correction)と呼ばれる適応型VPRシステム
A-MuSICは、テストされたすべてのベンチマークデータセット間で最先端のVPRパフォーマンスにマッチまたは打ち勝つ。
論文 参考訳(メタデータ) (2023-03-24T19:25:22Z) - Visual Place Recognition: A Tutorial [40.576083932383895]
本論文は視覚的位置認識に関する最初のチュートリアル論文である。
これは、VPR問題の定式化、汎用的なアルゴリズムパイプライン、VPRアプローチの評価方法などのトピックをカバーしている。
Pythonの実践的なコード例は、VPRの実装と評価について、将来的な実践者や研究者に示している。
論文 参考訳(メタデータ) (2023-03-06T16:52:11Z) - StructVPR: Distill Structural Knowledge with Weighting Samples for
Visual Place Recognition [49.58170209388029]
視覚的位置認識(VPR)は通常、特定の画像検索問題と見なされる。
我々は、RGBグローバル機能における構造的知識を高めるために、VPRのための新しいトレーニングアーキテクチャであるStructVPRを提案する。
計算コストを低く保ちながら最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-12-02T02:52:01Z) - Merging Classification Predictions with Sequential Information for
Lightweight Visual Place Recognition in Changing Environments [22.58641358408613]
低オーバーヘッド視覚的位置認識(VPR)は、非常に活発な研究トピックである。
モバイルロボティクスアプリケーションはローエンドのハードウェアの下で運用されることが多く、さらにハードウェア対応のシステムは、他のナビゲーションタスクのためにオンボードシステムリソースを解放することの恩恵を受けることができる。
この研究は、バイナリ重み付き分類器ネットワークと1次元畳み込みネットワークを組み合わせた新しいシステムの提案により、軽量なVPRに対処する。
論文 参考訳(メタデータ) (2022-10-03T11:42:08Z) - Delving into the Devils of Bird's-eye-view Perception: A Review,
Evaluation and Recipe [115.31507979199564]
鳥眼視(BEV)における知覚タスクの強力な表現の学習は、産業と学界の両方から注目されつつある。
センサーの構成が複雑化するにつれて、異なるセンサーからの複数のソース情報の統合と、統一されたビューにおける特徴の表現が重要になる。
BEV知覚の中核的な問題は、(a)視点からBEVへの視点変換を通して失われた3D情報を再構成する方法、(b)BEVグリッドにおける基底真理アノテーションの取得方法、(d)センサー構成が異なるシナリオでアルゴリズムを適応・一般化する方法にある。
論文 参考訳(メタデータ) (2022-09-12T15:29:13Z) - SwitchHit: A Probabilistic, Complementarity-Based Switching System for
Improved Visual Place Recognition in Changing Environments [20.917586014941033]
あらゆる種類の環境で動作可能な普遍的なVPR技術は存在しない。
リソース制約のある組み込みプラットフォームでは,複数のVPRテクニックの並列実行が禁止される可能性がある。
本稿では,確率的相補性に基づくスイッチングVPRシステムであるSwitchHitを提案する。
論文 参考訳(メタデータ) (2022-03-01T16:23:22Z) - A Benchmark Comparison of Visual Place Recognition Techniques for
Resource-Constrained Embedded Platforms [17.48671856442762]
本稿では,パブリックデータセット上での多数の最先端VPR技術について,ハードウェアに焦点を絞ったベンチマーク評価を行う。
我々は、ODroid、UP、Raspberry Pi 3などの一般的なシングルボードコンピュータに加えて、参照用のコモディティデスクトップとラップトップも検討している。
VPR技術のパフォーマンス精度は、プロセッサアーキテクチャでどのように変化しますか?
この研究の広範な分析と成果は、VPRコミュニティのベンチマークとして機能するだけでなく、VPRアプリケーションの現実的な採用に有用な洞察を提供する。
論文 参考訳(メタデータ) (2021-09-22T19:45:57Z) - Reasoning over Vision and Language: Exploring the Benefits of
Supplemental Knowledge [59.87823082513752]
本稿では,汎用知識基盤(KB)から視覚言語変換器への知識の注入について検討する。
我々は複数のタスクやベンチマークに対する様々なkbの関連性を実証的に研究する。
この技術はモデルに依存しず、最小限の計算オーバーヘッドで任意の視覚言語変換器の適用可能性を拡張することができる。
論文 参考訳(メタデータ) (2021-01-15T08:37:55Z) - Deep Learning for Person Re-identification: A Survey and Outlook [233.36948173686602]
人物再識別(Re-ID)は、複数の重複しないカメラを通して興味ある人物を検索することを目的としている。
人物のRe-IDシステム開発に関わるコンポーネントを分離することにより、それをクローズドワールドとオープンワールドのセッティングに分類する。
論文 参考訳(メタデータ) (2020-01-13T12:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。