論文の概要: Towards Test-time Efficient Visual Place Recognition via Asymmetric Query Processing
- arxiv url: http://arxiv.org/abs/2512.13055v1
- Date: Mon, 15 Dec 2025 07:30:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.571128
- Title: Towards Test-time Efficient Visual Place Recognition via Asymmetric Query Processing
- Title(参考訳): 非対称問合せ処理による実時間視覚位置認識の実現に向けて
- Authors: Jaeyoon Kim, Yoonki Cho, Sung-Eui Yoon,
- Abstract要約: 視覚的位置認識(VPR)は、DINOv2のような高容量の基礎モデルで大幅に進歩している。
その相当な計算コストは、リソースに制約のあるデバイスへの展開を非現実的にする。
本稿では,オフライン機能抽出のための高容量ギャラリーモデルと,オンライン処理のための軽量クエリネットワークを組み合わせた,効率的な非対称VPRフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.83974330459537
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual Place Recognition (VPR) has advanced significantly with high-capacity foundation models like DINOv2, achieving remarkable performance. Nonetheless, their substantial computational cost makes deployment on resource-constrained devices impractical. In this paper, we introduce an efficient asymmetric VPR framework that incorporates a high-capacity gallery model for offline feature extraction with a lightweight query network for online processing. A key challenge in this setting is ensuring compatibility between these heterogeneous networks, which conventional approaches address through computationally expensive k-NN-based compatible training. To overcome this, we propose a geographical memory bank that structures gallery features using geolocation metadata inherent in VPR databases, eliminating the need for exhaustive k-NN computations. Additionally, we introduce an implicit embedding augmentation technique that enhances the query network to model feature variations despite its limited capacity. Extensive experiments demonstrate that our method not only significantly reduces computational costs but also outperforms existing asymmetric retrieval techniques, establishing a new aspect for VPR in resource-limited environments. The code is available at https://github.com/jaeyoon1603/AsymVPR
- Abstract(参考訳): 視覚的位置認識(VPR)は、DINOv2のような高容量の基礎モデルで大幅に進歩し、優れたパフォーマンスを実現している。
それでも、その相当な計算コストは、リソースに制約のあるデバイスへのデプロイを非現実的にする。
本稿では,オフライン機能抽出のための高容量ギャラリーモデルと,オンライン処理のための軽量クエリネットワークを組み合わせた,効率的な非対称VPRフレームワークを提案する。
この設定における重要な課題は、計算コストの高いk-NNベースの互換性トレーニングを通じて対処する、これらの異種ネットワーク間の互換性を確保することである。
そこで本研究では,VPRデータベースに固有の位置情報メタデータを用いてギャラリー機能を構築することで,k-NN計算の網羅的不要性を排除した地理記憶バンクを提案する。
さらに,クエリネットワークを拡張して,限られたキャパシティに拘わらず,特徴変化をモデル化する暗黙的な埋め込み拡張手法を導入する。
大規模実験により,本手法は計算コストを大幅に削減するだけでなく,既存の非対称な検索手法よりも優れており,資源限定環境におけるVPRの新たな側面が確立されている。
コードはhttps://github.com/jaeyoon1603/AsymVPRで公開されている。
関連論文リスト
- Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。
KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文 参考訳(メタデータ) (2025-10-23T07:12:26Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Adaptive Anomaly Detection in Network Flows with Low-Rank Tensor Decompositions and Deep Unrolling [4.944495309580902]
異常検出(AD)は、将来の通信システムのレジリエンスを確保するための重要な要素として、ますます認識されている。
この研究は、不完全測定を用いたネットワークフローにおけるADについて考察する。
本稿では,正規化モデル適合性に基づくブロック帰属凸近似アルゴリズムを提案する。
ベイズ的アプローチに触発されて、我々はモデルアーキテクチャを拡張し、フローごとのオンライン適応とステップごとの統計処理を行う。
論文 参考訳(メタデータ) (2024-09-17T19:59:57Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - A New Clustering-Based Technique for the Acceleration of Deep
Convolutional Networks [2.7393821783237184]
MCA(Model Compression and Acceleration)技術は、大規模な事前学習ネットワークをより小さなモデルに変換するために用いられる。
本稿では,採用したセントロイド/表現量を増やすクラスタリングに基づく手法を提案する。
これは、被雇用者に対して特別な構造を課すことによって達成され、これは、目の前の問題の特異性によって実現される。
論文 参考訳(メタデータ) (2021-07-19T18:22:07Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。