論文の概要: Region Matters: Efficient and Reliable Region-Aware Visual Place Recognition
- arxiv url: http://arxiv.org/abs/2604.22390v1
- Date: Fri, 24 Apr 2026 09:28:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.414548
- Title: Region Matters: Efficient and Reliable Region-Aware Visual Place Recognition
- Title(参考訳): 地域問題:効率的で信頼性の高い地域対応視覚的場所認識
- Authors: Shunpeng Chen, Yukun Song, Changwei Wang, Rongtao Xu, Kexue Fu, Longxiang Gao, Li Guo, Ruisheng Wang, Shibiao Xu,
- Abstract要約: 本稿では,ロバストな識別領域モデリングと適応的再ランク付けを組み合わせたFoL++を提案する。
FoL++は、軽量なメモリフットプリントで最先端のパフォーマンスを実現し、FoLよりも推論速度を40%向上させる。
- 参考スコア(独自算出の注目度): 46.97190804063947
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Place Recognition (VPR) determines a query image's geographic location by matching it against geotagged databases. However, existing methods struggle with perceptual aliasing caused by irrelevant regions and inefficient re-ranking due to rigid candidate scheduling. To address these issues, we introduce FoL++, a method combining robust discriminative region modeling with adaptive re-ranking. Specifically, we propose a Reliability Estimation Branch to generate spatial reliability maps that explicitly model occlusion resistance. This representation is further optimized by two spatial alignment losses (SAL and SCEL) to effectively align features and highlight salient regions. For weakly supervised learning without manual annotations, a pseudo-correspondence strategy generates dense local feature supervision directly from aggregation clusters. Our Adaptive Candidate Scheduler dynamically resizes candidate pools based on global similarity. By weighting local matches by reliability and adaptively fusing global and local evidence, FoL++ surpasses traditional independent matching systems. Extensive experiments across seven benchmarks demonstrate that FoL++ achieves state-of-the-art performance with a lightweight memory footprint, improving inference speed by 40% over FoL. Code and models will be released (and merged with FoL) at https://github.com/chenshunpeng/FoL.
- Abstract(参考訳): ビジュアルプレース認識(VPR)は、ジオタグ付きデータベースとマッチングすることで、クエリ画像の地理的位置を決定する。
しかし、既存の手法では、無関係な領域による知覚的エイリアスと、厳格な候補スケジューリングによる非効率な再分類に苦慮している。
これらの問題に対処するために,ロバストな識別領域モデリングと適応的再ランク付けを組み合わせたFoL++を提案する。
具体的には,オクルージョン抵抗を明示的にモデル化した空間信頼性マップを生成するための信頼性推定枝を提案する。
この表現は2つの空間的アライメント損失(SALとSCEL)によってさらに最適化され、特徴を効果的に整列させ、顕著な領域を強調する。
手動のアノテーションを使わずに弱教師付き学習を行う場合、擬似対応戦略は集約クラスタから直接局所的特徴監督を直接生成する。
我々のAdaptive Candidate Schedulerは、グローバルな類似性に基づいて候補プールを動的にリサイズする。
信頼性によってローカルマッチを重み付けし、グローバルおよびローカルエビデンスを適応的に融合させることで、FoL++は従来の独立したマッチングシステムを超えている。
7つのベンチマークにわたる大規模な実験により、FoL++は軽量なメモリフットプリントで最先端のパフォーマンスを実現し、FoLよりも推論速度を40%向上した。
コードとモデルはhttps://github.com/chenshunpeng/FoLでリリースされる。
関連論文リスト
- Automatic Map Density Selection for Locally-Performant Visual Place Recognition [16.893170921147608]
本稿では,対象環境からの参照トラバースのペアを用いて,適切な地図密度を自動的に選択する動的VPRマッピング手法を提案する。
提案システムは,少なくともユーザによって特定された環境の割合に対して,特定ローカルリコールレベルを一貫して達成または超過することを示す。
論文 参考訳(メタデータ) (2026-02-25T01:03:34Z) - Focus on Local: Finding Reliable Discriminative Regions for Visual Place Recognition [26.27331683733832]
視覚的位置認識(VPR)は、ジオタグ付き画像のデータベースを参照することにより、クエリ画像の位置を予測することを目的としている。
既存の手法では、識別領域の正確なモデリングと完全な利用が欠如している。
本稿では、画像検索とVPRにおける再ランク付けを同時に行うために、FoL(FoL)アプローチを提案する。
論文 参考訳(メタデータ) (2025-04-14T05:04:51Z) - Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition [72.35438297011176]
視覚的位置認識のための事前学習モデル(VPR)のシームレスな適応を実現する新しい手法を提案する。
具体的には、地域を識別するための有意義なランドマークに焦点を当てたグローバルな特徴とローカルな特徴の両方を得るために、ハイブリッド適応法を設計する。
実験結果から,本手法はトレーニングデータやトレーニング時間が少なく,最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-02-22T12:55:01Z) - Decoupled Local Aggregation for Point Cloud Learning [12.810517967372043]
本稿では,局所的な集合から空間関係の明示的なモデリングを分離することを提案する。
本稿では,各学習段階で相対的な空間符号化が最初に形成される軽量な点ネットワークであるDeLAを提案する。
DeLAはScanObjectNNで90%以上、S3DIS Area 5で74% mIoUを達成した。
論文 参考訳(メタデータ) (2023-08-31T08:21:29Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。