論文の概要: Beyond ANN: Exploiting Structural Knowledge for Efficient Place
Recognition
- arxiv url: http://arxiv.org/abs/2103.08366v1
- Date: Mon, 15 Mar 2021 13:10:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 13:52:41.774900
- Title: Beyond ANN: Exploiting Structural Knowledge for Efficient Place
Recognition
- Title(参考訳): Beyond ANN: 効率的な場所認識のための構造知識の探索
- Authors: Stefan Schubert, Peer Neubert, Peter Protzel
- Abstract要約: オンラインで適用可能な効率的な位置認識のための新しい高速シーケンスベースの方法を提案する。
提案手法は,2つの最先端手法と,多くの場合,フル画像比較に優れる。
- 参考スコア(独自算出の注目度): 8.121462458089143
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual place recognition is the task of recognizing same places of query
images in a set of database images, despite potential condition changes due to
time of day, weather or seasons. It is important for loop closure detection in
SLAM and candidate selection for global localization. Many approaches in the
literature perform computationally inefficient full image comparisons between
queries and all database images. There is still a lack of suited methods for
efficient place recognition that allow a fast, sparse comparison of only the
most promising image pairs without any loss in performance. While this is
partially given by ANN-based methods, they trade speed for precision and
additional memory consumption, and many cannot find arbitrary numbers of
matching database images in case of loops in the database. In this paper, we
propose a novel fast sequence-based method for efficient place recognition that
can be applied online. It uses relocalization to recover from sequence losses,
and exploits usually available but often unused intra-database similarities for
a potential detection of all matching database images for each query in case of
loops or stops in the database. We performed extensive experimental evaluations
over five datasets and 21 sequence combinations, and show that our method
outperforms two state-of-the-art approaches and even full image comparisons in
many cases, while providing a good tradeoff between performance and percentage
of evaluated image pairs. Source code for Matlab will be provided with
publication of this paper.
- Abstract(参考訳): 視覚的な場所認識は、日時、天候、季節によって潜在的条件が変化しても、データベースイメージのセットで同じ場所の問い合わせ画像を認識するタスクである。
SLAMにおけるループ閉鎖検出とグローバルなローカライゼーションのための候補選択に重要である。
文献における多くのアプローチは、クエリとすべてのデータベースイメージ間の計算効率の悪いフルイメージ比較を行う。
パフォーマンスを損なうことなく、最も有望な画像ペアのみを迅速かつスパースに比較できる、効率的な位置認識のための適切な方法がまだ欠落している。
これは部分的にANNベースの方法によって与えられるが、それらは精度と追加のメモリ消費のために速度を交換し、多くはデータベース内のループの場合に一致するデータベースイメージの任意の数を見つけることができません。
本稿では,オンラインに適用可能な効率的な位置認識のための高速シーケンスベース手法を提案する。
シーケンスの損失から回復するために再ローカライズを使用し、通常利用可能なが、データベース内の不使用の類似性を利用して、データベース内のループや停止の場合には、クエリ毎に一致するデータベースイメージを検出できる。
5つのデータセットと21のシーケンスの組み合わせについて広範な実験を行い,本手法が2つの最先端手法,さらにはフルイメージ比較よりも優れており,その性能と評価画像ペアの割合とのトレードオフも良好であることを示す。
Matlabのソースコードは、この論文の公開を予定している。
関連論文リスト
- Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - MaskSearch: Querying Image Masks at Scale [60.82746984506577]
MaskSearchは、クエリ結果の正確性を確保しながら、イメージマスクのデータベース上でクエリを高速化するシステムである。
試行錯誤実験の結果,圧縮データサイズの約5%のインデックスを用いたMaskSearchは,最大2桁のクエリを高速化することがわかった。
論文 参考訳(メタデータ) (2023-05-03T18:28:14Z) - Are Local Features All You Need for Cross-Domain Visual Place
Recognition? [13.519413608607781]
視覚的位置認識は、視覚的手がかりのみに基づいて画像の座標を予測することを目的としている。
近年の進歩にもかかわらず、クエリがかなり異なる分布から来るのと同じ場所を認識することは、依然として最先端の検索手法にとって大きなハードルである。
本研究では,空間的検証に基づく手法がこれらの課題に対処できるかどうかを考察する。
論文 参考訳(メタデータ) (2023-04-12T14:46:57Z) - Efficient Image-Text Retrieval via Keyword-Guided Pre-Screening [53.1711708318581]
現在の画像テキスト検索法は、N$関連時間複雑さに悩まされている。
本稿では,画像テキスト検索のための簡易かつ効果的なキーワード誘導事前スクリーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-14T09:36:42Z) - ALADIN: Distilling Fine-grained Alignment Scores for Efficient
Image-Text Matching and Retrieval [51.588385824875886]
クロスモーダル検索は、与えられたクエリテキストまたはバイヴァーサに関連する画像を見つけることで構成される。
近年の多くの手法が画像テキストマッチング問題に対する効果的な解法を提案しており、主に近年の大規模視覚言語(VL)トランスフォーマーネットワークを用いている。
本稿では,有効性と効率のギャップを埋めるため,ALADIN(ALign And Distill Network)を提案する。
論文 参考訳(メタデータ) (2022-07-29T16:01:48Z) - Tune It or Don't Use It: Benchmarking Data-Efficient Image
Classification [9.017660524497389]
様々な領域にまたがる6つの多様なデータセットからなるデータ効率画像分類のためのベンチマークを設計する。
我々は、2017年から2021年にかけて、標準のクロスエントロピーベースラインとデータ効率の高いディープラーニングの8つの手法を再評価した。
学習率、ウェイト崩壊、バッチサイズを個別の検証で調整すると、高い競争力を持つベースラインとなる。
論文 参考訳(メタデータ) (2021-08-30T11:24:51Z) - Recall@k Surrogate Loss with Large Batches and Similarity Mixup [62.67458021725227]
微分不可能な場合、評価計量の勾配降下による直接最適化は不可能である。
本研究は,リコールにおける相異なるサロゲート損失を提案する。
提案手法は,複数の画像検索ベンチマークにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-08-25T11:09:11Z) - Efficient image retrieval using multi neural hash codes and bloom
filters [0.0]
本稿では,複数のニューラルハッシュ符号を用いた画像検索手法を提案する。
また、事前に偽陽性を識別することで、ブルームフィルタを使用したクエリの数を制限する。
論文 参考訳(メタデータ) (2020-11-06T08:46:31Z) - Fast and Incremental Loop Closure Detection with Deep Features and
Proximity Graphs [13.328790865796224]
本稿では、FILD++という名前の外観に基づくループクロージャ検出パイプラインを提案する。
システムは連続した画像によって供給され、単一の畳み込みニューラルネットワークを2回通すことで、大域的および局所的な深い特徴を抽出する。
画像と画像のペアリングは、局所的な特徴を利用して空間情報を評価する。
論文 参考訳(メタデータ) (2020-09-29T02:42:47Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。