Fugu-MT 論文翻訳(概要): Improving Visual Place Recognition Performance by Maximising Complementarity

論文の概要: Improving Visual Place Recognition Performance by Maximising Complementarity

arxiv url: http://arxiv.org/abs/2102.08416v1
Date: Tue, 16 Feb 2021 19:18:33 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-19 05:09:05.252419
Title: Improving Visual Place Recognition Performance by Maximising Complementarity
Title（参考訳）: 相補性最大化による視覚位置認識性能の向上
Authors: Maria Waheed, Michael Milford, Klaus D. McDonald-Maier, Shoaib Ehsan
Abstract要約: 本稿では,最先端VPR手法の相互補完性を初めて体系的に検討する。それらの組み合わせを識別することで、パフォーマンスが向上する。結果は、広く使われている10のVPRデータセット上で8つの最先端のVPR手法に対して提示される。
参考スコア（独自算出の注目度）: 22.37892767050086
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Visual place recognition (VPR) is the problem of recognising a previously visited location using visual information. Many attempts to improve the performance of VPR methods have been made in the literature. One approach that has received attention recently is the multi-process fusion where different VPR methods run in parallel and their outputs are combined in an effort to achieve better performance. The multi-process fusion, however, does not have a well-defined criterion for selecting and combining different VPR methods from a wide range of available options. To the best of our knowledge, this paper investigates the complementarity of state-of-the-art VPR methods systematically for the first time and identifies those combinations which can result in better performance. The paper presents a well-defined framework which acts as a sanity check to find the complementarity between two techniques by utilising a McNemar's test-like approach. The framework allows estimation of upper and lower complementarity bounds for the VPR techniques to be combined, along with an estimate of maximum VPR performance that may be achieved. Based on this framework, results are presented for eight state-of-the-art VPR methods on ten widely-used VPR datasets showing the potential of different combinations of techniques for achieving better performance.
Abstract（参考訳）: 視覚的位置認識(VPR)は、これまで訪れた場所を視覚情報を用いて認識する問題である。 VPR法の性能向上のための多くの試みが文献で行われている。最近注目されているアプローチの1つは、異なるVPRメソッドが並列に実行されるマルチプロセス融合であり、その出力はより良いパフォーマンスを達成するために組み合わせられている。しかし、マルチプロセス融合は、様々なオプションから異なるVPRメソッドを選択し、組み合わせるための明確な基準を持っていない。そこで本研究では,最先端のVPR手法の相互補完性を初めて体系的に検討し,それらの組み合わせによって性能が向上することを示す。本稿は,mcnemarテストライクなアプローチを活用し,2つの手法間の相補性を見出すための健全性チェックとして機能する,明確に定義されたフレームワークを提案する。このフレームワークにより、vpr技術の上位および下位の相補性境界の推定と、達成可能な最大vpr性能の推定を組み合わせることができる。この枠組みに基づいて,10個の広く使用されているVPRデータセット上で8つの最先端VPR手法について,性能向上のための異なる組み合わせの可能性を示す結果が提示される。

関連論文リスト

Improving Visual Place Recognition with Sequence-Matching Receptiveness Prediction [19.577433371468533]
本稿では,VPR手法のフレーム単位のシーケンスマッチング受容性(SMR)を予測するための教師付き学習手法を提案する。我々の手法は、最先端および古典的なVPR技術において、VPR性能を著しく向上させる。
論文参考訳（メタデータ） (2025-03-10T02:01:24Z)
SelaVPR++: Towards Seamless Adaptation of Foundation Models for Efficient Place Recognition [69.58329995485158]
近年の研究では、事前学習した視覚基盤モデルを用いた視覚的位置認識(VPR)法が有望な性能を達成できることが示されている。本稿では,基礎モデルのVPRへのシームレスな適応を実現する新しい手法を提案する。効率の向上と性能向上のために,SelaVPR++と呼ばれるSelaVPRの拡張を提案する。
論文参考訳（メタデータ） (2025-02-23T15:01:09Z)
Revisiting BPR: A Replicability Study of a Common Recommender System Baseline [78.00363373925758]
我々は,BPRモデルの特徴を考察し,その性能への影響を示し,オープンソースのBPR実装について検討する。分析の結果,これらの実装とオリジナルのBPR論文の矛盾が明らかとなり,特定の実装に対して最大50%の性能低下がみられた。 BPRモデルは、トップnのレコメンデーションタスクにおける最先端メソッドに近いパフォーマンスレベルを達成でき、特定のデータセット上でもパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (2024-09-21T18:39:53Z)
Improving Out-of-Distribution Detection by Combining Existing Post-hoc Methods [1.747623282473278]
ポストホックディープ・オブ・ディストリビューション(OOD)検出は急速に拡大した。現在のベストプラクティスは、手元にあるデータセット上のすべてのメソッドをテストすることです。本稿では,OOD検出を効果的に組み合わせるための新しい手法の開発に焦点を移す。
論文参考訳（メタデータ） (2024-07-09T15:46:39Z)
Evaluating Ensemble Methods for News Recommender Systems [50.90330146667386]
本稿では,Microsoft News データセット (MIND) において,様々な最先端アルゴリズムを組み合わさって優れた結果を得るために,アンサンブル手法をどのように利用できるかを示す。その結果,NRSアルゴリズムの組み合わせは,基礎学習者が十分に多様であることから,個々のアルゴリズムよりも優れていることがわかった。
論文参考訳（メタデータ） (2024-06-23T13:40:50Z)
EffoVPR: Effective Foundation Model Utilization for Visual Place Recognition [6.996304653818122]
本稿では,視覚的位置認識のための基礎モデルの可能性を活用するための効果的なアプローチを提案する。ゼロショット設定であっても,自己注意層から抽出した特徴がVPRの強力な再ランカとして機能することを示す。また,本手法は高いロバスト性および一般化を実証し,新しい最先端性能の設定を行う。
論文参考訳（メタデータ） (2024-05-28T11:24:41Z)
Once for Both: Single Stage of Importance and Sparsity Search for Vision Transformer Compression [63.23578860867408]
重要度評価と疎度評価を1段階にまとめる方法について検討する。重要度と疎度の両方を同時に評価するコスト効率の高いOFBを提案する。実験により、OFBは最先端のサーチベースおよびプルーニングベース手法よりも優れた圧縮性能が得られることが示された。
論文参考訳（メタデータ） (2024-03-23T13:22:36Z)
A Complementarity-Based Switch-Fuse System for Improved Visual Place Recognition [19.14779092252812]
Switch-Fuseは、相補性に基づくVPR技術の変更の堅牢性と、慎重に選択したテクニックを融合させて性能を著しく向上させる力を組み合わせた興味深い方法である。このシステムは2つの重要なプロセス(VPR技法の切り替えと融合)を組み合わせることで、ハイブリッドモデルと組み合わせることで、PR曲線を用いて示されるすべての主要なVPRデータセットのパフォーマンスを大幅に改善する。
論文参考訳（メタデータ） (2023-03-01T18:19:10Z)
Boosting Performance of a Baseline Visual Place Recognition Technique by Predicting the Maximally Complementary Technique [25.916992891359055]
最近の視覚的位置認識問題に対する有望な1つのアプローチは、複数の相補的なVPR手法の場所認識推定を融合させることである。これらのアプローチでは、選択的に融合する前にすべての潜在的なVPRメソッドをブルートフォースで実行する必要がある。ここでは、既知の単一ベースVPR技術から始まる別のアプローチを提案し、それと融合するために最も相補的な付加VPR技術を予測することを学ぶ。
論文参考訳（メタデータ） (2022-10-14T04:32:23Z)
Towards Better Understanding Attribution Methods [77.1487219861185]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。また,いくつかの属性法の性能を著しく向上する処理後平滑化ステップを提案する。
論文参考訳（メタデータ） (2022-05-20T20:50:17Z)
An Efficient Combinatorial Optimization Model Using Learning-to-Rank Distillation [2.0137632982900207]
本稿では, 高速なランク付けポリシを非定型的, 簡易なモデルに抽出可能な, 学習からランク付けへの蒸留に基づくCOPフレームワークを提案する。具体的には、近似されたランキング蒸留を用いて、勾配降下によるスコアベースランキングモデルを学習可能にする。蒸留されたモデルは, それぞれの高性能RLに匹敵する性能を達成できるが, 数倍高速な推算も可能であることを実証する。
論文参考訳（メタデータ） (2021-12-24T10:52:47Z)
Unsupervised Complementary-aware Multi-process Fusion for Visual Place Recognition [28.235055888073855]
本稿では,現在のデプロイメント環境において,最も堅牢なVPR技術群を探索する教師なしアルゴリズムを提案する。提案した動的マルチプロセス融合(Dyn-MPF)は,様々な競合手法と比較して,VPR性能が優れている。
論文参考訳（メタデータ） (2021-12-09T04:57:33Z)
Revisiting The Evaluation of Class Activation Mapping for Explainability: A Novel Metric and Experimental Analysis [54.94682858474711]
クラスアクティベーションマッピング(cam)アプローチは、アクティベーションマップの平均を重み付けすることで、効果的な可視化を提供する。説明マップを定量化するための新しいメトリクスセットを提案し、より効果的な方法を示し、アプローチ間の比較を簡素化します。
論文参考訳（メタデータ） (2021-04-20T21:34:24Z)
Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文参考訳（メタデータ） (2020-03-03T15:20:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。