論文の概要: Improving Visual Place Recognition Performance by Maximising
Complementarity
- arxiv url: http://arxiv.org/abs/2102.08416v1
- Date: Tue, 16 Feb 2021 19:18:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 05:09:05.252419
- Title: Improving Visual Place Recognition Performance by Maximising
Complementarity
- Title(参考訳): 相補性最大化による視覚位置認識性能の向上
- Authors: Maria Waheed, Michael Milford, Klaus D. McDonald-Maier, Shoaib Ehsan
- Abstract要約: 本稿では,最先端VPR手法の相互補完性を初めて体系的に検討する。
それらの組み合わせを識別することで、パフォーマンスが向上する。
結果は、広く使われている10のVPRデータセット上で8つの最先端のVPR手法に対して提示される。
- 参考スコア(独自算出の注目度): 22.37892767050086
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual place recognition (VPR) is the problem of recognising a previously
visited location using visual information. Many attempts to improve the
performance of VPR methods have been made in the literature. One approach that
has received attention recently is the multi-process fusion where different VPR
methods run in parallel and their outputs are combined in an effort to achieve
better performance. The multi-process fusion, however, does not have a
well-defined criterion for selecting and combining different VPR methods from a
wide range of available options. To the best of our knowledge, this paper
investigates the complementarity of state-of-the-art VPR methods systematically
for the first time and identifies those combinations which can result in better
performance. The paper presents a well-defined framework which acts as a sanity
check to find the complementarity between two techniques by utilising a
McNemar's test-like approach. The framework allows estimation of upper and
lower complementarity bounds for the VPR techniques to be combined, along with
an estimate of maximum VPR performance that may be achieved. Based on this
framework, results are presented for eight state-of-the-art VPR methods on ten
widely-used VPR datasets showing the potential of different combinations of
techniques for achieving better performance.
- Abstract(参考訳): 視覚的位置認識(VPR)は、これまで訪れた場所を視覚情報を用いて認識する問題である。
VPR法の性能向上のための多くの試みが文献で行われている。
最近注目されているアプローチの1つは、異なるVPRメソッドが並列に実行されるマルチプロセス融合であり、その出力はより良いパフォーマンスを達成するために組み合わせられている。
しかし、マルチプロセス融合は、様々なオプションから異なるVPRメソッドを選択し、組み合わせるための明確な基準を持っていない。
そこで本研究では,最先端のVPR手法の相互補完性を初めて体系的に検討し,それらの組み合わせによって性能が向上することを示す。
本稿は,mcnemarテストライクなアプローチを活用し,2つの手法間の相補性を見出すための健全性チェックとして機能する,明確に定義されたフレームワークを提案する。
このフレームワークにより、vpr技術の上位および下位の相補性境界の推定と、達成可能な最大vpr性能の推定を組み合わせることができる。
この枠組みに基づいて,10個の広く使用されているVPRデータセット上で8つの最先端VPR手法について,性能向上のための異なる組み合わせの可能性を示す結果が提示される。
関連論文リスト
- Better Understanding Differences in Attribution Methods via Systematic
Evaluations [77.1487219861185]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
これらの評価手法を用いて、広範囲のモデルにおいて広く用いられている属性手法の長所と短所について検討する。
論文 参考訳(メタデータ) (2023-03-21T14:24:58Z) - A Complementarity-Based Switch-Fuse System for Improved Visual Place
Recognition [19.14779092252812]
Switch-Fuseは、相補性に基づくVPR技術の変更の堅牢性と、慎重に選択したテクニックを融合させて性能を著しく向上させる力を組み合わせた興味深い方法である。
このシステムは2つの重要なプロセス(VPR技法の切り替えと融合)を組み合わせることで、ハイブリッドモデルと組み合わせることで、PR曲線を用いて示されるすべての主要なVPRデータセットのパフォーマンスを大幅に改善する。
論文 参考訳(メタデータ) (2023-03-01T18:19:10Z) - Learning to Agree on Vision Attention for Visual Commonsense Reasoning [50.904275811951614]
VCRモデルは、画像に関する質問に答えることを目的としており、続いて、前の回答プロセスの合理性予測が続く。
既存の手法は2つのプロセス間の重要な関係を無視し、最適化されたモデルの性能をもたらす。
本稿では,これら2つのプロセスを統一的な枠組みで効果的に処理する新しい視覚的アライメント手法を提案する。
論文 参考訳(メタデータ) (2023-02-04T07:02:29Z) - Boosting Performance of a Baseline Visual Place Recognition Technique by
Predicting the Maximally Complementary Technique [25.916992891359055]
最近の視覚的位置認識問題に対する有望な1つのアプローチは、複数の相補的なVPR手法の場所認識推定を融合させることである。
これらのアプローチでは、選択的に融合する前にすべての潜在的なVPRメソッドをブルートフォースで実行する必要がある。
ここでは、既知の単一ベースVPR技術から始まる別のアプローチを提案し、それと融合するために最も相補的な付加VPR技術を予測することを学ぶ。
論文 参考訳(メタデータ) (2022-10-14T04:32:23Z) - Towards Better Understanding Attribution Methods [77.1487219861185]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
また,いくつかの属性法の性能を著しく向上する処理後平滑化ステップを提案する。
論文 参考訳(メタデータ) (2022-05-20T20:50:17Z) - SwitchHit: A Probabilistic, Complementarity-Based Switching System for
Improved Visual Place Recognition in Changing Environments [20.917586014941033]
あらゆる種類の環境で動作可能な普遍的なVPR技術は存在しない。
リソース制約のある組み込みプラットフォームでは,複数のVPRテクニックの並列実行が禁止される可能性がある。
本稿では,確率的相補性に基づくスイッチングVPRシステムであるSwitchHitを提案する。
論文 参考訳(メタデータ) (2022-03-01T16:23:22Z) - An Efficient Combinatorial Optimization Model Using Learning-to-Rank
Distillation [2.0137632982900207]
本稿では, 高速なランク付けポリシを非定型的, 簡易なモデルに抽出可能な, 学習からランク付けへの蒸留に基づくCOPフレームワークを提案する。
具体的には、近似されたランキング蒸留を用いて、勾配降下によるスコアベースランキングモデルを学習可能にする。
蒸留されたモデルは, それぞれの高性能RLに匹敵する性能を達成できるが, 数倍高速な推算も可能であることを実証する。
論文 参考訳(メタデータ) (2021-12-24T10:52:47Z) - Unsupervised Complementary-aware Multi-process Fusion for Visual Place
Recognition [28.235055888073855]
本稿では,現在のデプロイメント環境において,最も堅牢なVPR技術群を探索する教師なしアルゴリズムを提案する。
提案した動的マルチプロセス融合(Dyn-MPF)は,様々な競合手法と比較して,VPR性能が優れている。
論文 参考訳(メタデータ) (2021-12-09T04:57:33Z) - Revisiting The Evaluation of Class Activation Mapping for
Explainability: A Novel Metric and Experimental Analysis [54.94682858474711]
クラスアクティベーションマッピング(cam)アプローチは、アクティベーションマップの平均を重み付けすることで、効果的な可視化を提供する。
説明マップを定量化するための新しいメトリクスセットを提案し、より効果的な方法を示し、アプローチ間の比較を簡素化します。
論文 参考訳(メタデータ) (2021-04-20T21:34:24Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。