Fugu-MT 論文翻訳(概要): To Match or Not to Match: Revisiting Image Matching for Reliable Visual Place Recognition

論文の概要: To Match or Not to Match: Revisiting Image Matching for Reliable Visual Place Recognition

arxiv url: http://arxiv.org/abs/2504.06116v1
Date: Tue, 08 Apr 2025 15:10:10 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-16 16:32:45.770006
Title: To Match or Not to Match: Revisiting Image Matching for Reliable Visual Place Recognition
Title（参考訳）: マッチングするかどうか:信頼性の高い視覚的位置認識のための画像マッチングの再検討
Authors: Davide Sferrazza, Gabriele Berton, Gabriele Trivigno, Carlo Masone,
Abstract要約: 現代の検索システムは、現在のVPRデータセットがほぼ飽和しているため、再ランク付けによって結果が劣化する点にしばしば到達している。画像マッチングを検証ステップとして使用して、再ランク付けが有益であるときに、不整合値が確実に予測できることを実証する。
参考スコア（独自算出の注目度）: 4.008780119020479
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Visual Place Recognition (VPR) is a critical task in computer vision, traditionally enhanced by re-ranking retrieval results with image matching. However, recent advancements in VPR methods have significantly improved performance, challenging the necessity of re-ranking. In this work, we show that modern retrieval systems often reach a point where re-ranking can degrade results, as current VPR datasets are largely saturated. We propose using image matching as a verification step to assess retrieval confidence, demonstrating that inlier counts can reliably predict when re-ranking is beneficial. Our findings shift the paradigm of retrieval pipelines, offering insights for more robust and adaptive VPR systems.
Abstract（参考訳）: 視覚的位置認識(VPR)はコンピュータビジョンにおいて重要な課題であり、伝統的に画像マッチングによる検索結果の再ランク付けによって強化されてきた。しかし、近年のVPR手法の進歩により性能が大幅に向上し、再ランク付けの必要性が高まっている。本稿では,現在のVPRデータセットがほぼ飽和しているため,近年の検索システムにおいて,再ランク付けによって結果が劣化する点がしばしばあることを示す。画像マッチングを検証ステップとして使用して、再ランク付けが有益である場合に、不整合値が確実に予測できることを実証する。我々の発見は、より堅牢で適応的なVPRシステムに対する洞察を提供する、検索パイプラインのパラダイムを変える。

関連論文リスト

RAVID: Retrieval-Augmented Visual Detection: A Knowledge-Driven Approach for AI-Generated Image Identification [14.448350657613368]
RAVIDは、視覚検索強化生成(RAG)を活用するAI生成画像検出のための最初のフレームワークである提案手法では,表現学習を改善するためにカテゴリ関連プロンプトを付加した細調整のCLIP画像エンコーダであるRAVID CLIPを利用する。 RAVIDの平均精度は80.27%で、最先端のC2P-CLIPでは63.44%である。
論文参考訳（メタデータ） (2025-08-05T23:10:56Z)
Improving Visual Place Recognition with Sequence-Matching Receptiveness Prediction [19.577433371468533]
本稿では,VPR手法のフレーム単位のシーケンスマッチング受容性(SMR)を予測するための教師付き学習手法を提案する。我々の手法は、最先端および古典的なVPR技術において、VPR性能を著しく向上させる。
論文参考訳（メタデータ） (2025-03-10T02:01:24Z)
SelaVPR++: Towards Seamless Adaptation of Foundation Models for Efficient Place Recognition [69.58329995485158]
近年の研究では、事前学習した視覚基盤モデルを用いた視覚的位置認識(VPR)法が有望な性能を達成できることが示されている。本稿では,基礎モデルのVPRへのシームレスな適応を実現する新しい手法を提案する。効率の向上と性能向上のために,SelaVPR++と呼ばれるSelaVPRの拡張を提案する。
論文参考訳（メタデータ） (2025-02-23T15:01:09Z)
Pair-VPR: Place-Aware Pre-training and Contrastive Pair Classification for Visual Place Recognition with Vision Transformers [6.890658812702241]
視覚的位置認識(VPR)のための新しい共同学習法を提案する。ペア分類器は、与えられた画像のペアが同じ場所から来ているか否かを予測することができる。トレーニングの第2段階でMaskイメージモデリングエンコーダとデコーダウェイトを再使用することにより、Pair-VPRは最先端のVPRパフォーマンスを実現することができる。
論文参考訳（メタデータ） (2024-10-09T07:09:46Z)
Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。 VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文参考訳（メタデータ） (2024-06-23T20:00:20Z)
CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition [73.51329037954866]
視覚的位置認識のための画像間相関認識を用いたロバストなグローバル表現手法を提案する。本手法では,バッチ内の複数の画像の相関にアテンション機構を用いる。本手法は,訓練時間を大幅に短縮し,最先端の手法よりも優れた性能を示す。
論文参考訳（メタデータ） (2024-02-29T15:05:11Z)
Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文参考訳（メタデータ） (2024-02-25T13:22:17Z)
Distillation Improves Visual Place Recognition for Low Quality Images [13.440872071847627]
リアルタイムの視覚的ローカライゼーションはしばしばオンラインコンピューティングを利用しており、クエリ画像やビデオは視覚的位置認識(VPR)のためにリモートサーバに送信される。限られたネットワーク帯域幅は、画像品質の低下と、大域的な画像記述子の劣化を必要とし、VPRの精度を低下させる。本稿では,高品質な画像から特徴表現を学習し,低品質な画像からより識別性の高い記述子を抽出する知識蒸留手法を用いて,記述子抽出レベルでこの問題に対処する。
論文参考訳（メタデータ） (2023-10-10T18:03:29Z)
Graph Convolution Based Efficient Re-Ranking for Visual Retrieval [29.804582207550478]
特徴を更新することで、初期検索結果を洗練する効率的な再ランク付け手法を提案する。具体的には、グラフ畳み込みネットワーク(GCN)に基づく再ランク付けを再構成し、特徴伝搬による視覚的検索タスクのための新しいグラフ畳み込みベース再ランク付け(GCR)を提案する。特に、平面GCRは、クロスカメラ検索のために拡張され、異なるカメラ間の親和性関係を活用するために、改良された特徴伝搬定式化が提示される。
論文参考訳（メタデータ） (2023-06-15T00:28:08Z)
$R^{2}$Former: Unified $R$etrieval and $R$eranking Transformer for Place Recognition [92.56937383283397]
検索と再ランクの両方を扱う統合された場所認識フレームワークを提案する。提案モジュールは特徴相関,注目値,xy座標を考慮に入れている。 R2$Formerは、主要なVPRデータセットの最先端メソッドを著しく上回る。
論文参考訳（メタデータ） (2023-04-06T23:19:32Z)
Contextual Similarity Aggregation with Self-attention for Visual Re-ranking [96.55393026011811]
本稿では,自己注意を伴う文脈的類似性集約による視覚的再ランク付け手法を提案する。提案手法の汎用性と有効性を示すため,4つのベンチマークデータセットの総合的な実験を行った。
論文参考訳（メタデータ） (2021-10-26T06:20:31Z)
Graph Sampling Based Deep Metric Learning for Generalizable Person Re-Identification [114.56752624945142]
我々は、最も一般的なランダムサンプリング手法である有名なpkサンプリングは、深層メトリック学習にとって有益で効率的ではないと主張する。大規模計量学習のためのグラフサンプリング(GS)と呼ばれる効率的なミニバッチサンプリング手法を提案する。
論文参考訳（メタデータ） (2021-04-04T06:44:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。