論文の概要: Real-Time Loop Closure Detection in Visual SLAM via NetVLAD and Faiss
- arxiv url: http://arxiv.org/abs/2602.01673v1
- Date: Mon, 02 Feb 2026 05:41:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.930734
- Title: Real-Time Loop Closure Detection in Visual SLAM via NetVLAD and Faiss
- Title(参考訳): NetVLADとフェースによる視覚SLAMのリアルタイムループ閉鎖検出
- Authors: Enguang Fan,
- Abstract要約: ループクロージャ検出(LCD)は同時局所化とマッピング(SLAM)のコアコンポーネントである
本稿では,NetVLADをLCDモジュールとして実証的に評価し,KITTIデータセット上のDBoWと比較する。
クエリが0または複数の有効なマッチを持つ場合のLCD設定をより良く反映する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Loop closure detection (LCD) is a core component of simultaneous localization and mapping (SLAM): it identifies revisited places and enables pose-graph constraints that correct accumulated drift. Classic bag-of-words approaches such as DBoW are efficient but often degrade under appearance change and perceptual aliasing. In parallel, deep learning-based visual place recognition (VPR) descriptors (e.g., NetVLAD and Transformer-based models) offer stronger robustness, but their computational cost is often viewed as a barrier to real-time SLAM. In this paper, we empirically evaluate NetVLAD as an LCD module and compare it against DBoW on the KITTI dataset. We introduce a Fine-Grained Top-K precision-recall curve that better reflects LCD settings where a query may have zero or multiple valid matches. With Faiss-accelerated nearestneighbor search, NetVLAD achieves real-time query speed while improving accuracy and robustness over DBoW, making it a practical drop-in alternative for LCD in SLAM.
- Abstract(参考訳): ループクロージャ検出(LCD)は、同時局所化とマッピング(SLAM)のコアコンポーネントである。
DBoWのような古典的なバズ・オブ・ワードのアプローチは効率的だが、外見の変化や知覚的エイリアスによってしばしば劣化する。
並行して、ディープラーニングベースの視覚的位置認識(VPR)ディスクリプタ(NetVLADやTransformerベースのモデルなど)は強力な堅牢性を提供するが、その計算コストはリアルタイムSLAMの障壁と見なされることが多い。
本稿では,NetVLADをLCDモジュールとして実証的に評価し,KITTIデータセット上のDBoWと比較する。
クエリが0または複数の有効なマッチを持つ場合のLCD設定をより良く反映する。
Faiss-accelerated Nearnebor searchにより、NetVLADはDBoWの精度とロバスト性を改善しながらリアルタイムのクエリ速度を実現し、SLAMにおけるLCDの実用的な代替手段となる。
関連論文リスト
- Video Depth Propagation [54.523028170425256]
既存の手法は単純なフレーム・バイ・フレームの単分子モデルに依存しており、時間的矛盾と不正確な結果をもたらす。
本稿では,オンラインビデオパイプラインを効果的に活用し,深い特徴伝達を行うVeloDepthを提案する。
構造的に時間的整合性を強制し, 連続するフレーム間に安定した深さ予測を行い, 効率を向上する。
論文 参考訳(メタデータ) (2025-12-11T15:08:37Z) - Learning Frequency and Memory-Aware Prompts for Multi-Modal Object Tracking [74.15663758681849]
凍結したRGBトラッカーに軽量なプロンプトを注入するデュアルアダプタフレームワークであるLearning Frequency and Memory-Aware Promptsを紹介する。
周波数誘導型ビジュアルアダプタは、相補的なキューをモダリティ間で適応的に転送する。
短い、長い、永続的なメモリストアを持つマルチレベルメモリアダプタは、信頼できる時間的コンテキストを格納し、更新し、取得する。
論文 参考訳(メタデータ) (2025-06-30T15:38:26Z) - Loopy-SLAM: Dense Neural SLAM with Loop Closures [53.11936461015725]
ポーズをグローバルに最適化するLoopy-SLAMと高密度3Dモデルを導入する。
我々は,データ駆動のポイントベースサブマップ生成手法を用いてフレーム・ツー・モデル追跡を行い,グローバルな位置認識を行うことで,オンラインのループクロージャをトリガーする。
合成Replicaおよび実世界のTUM-RGBDおよびScanNetデータセットの評価は、既存の高密度ニューラルネットワークRGBD SLAM法と比較して、追跡、マッピング、レンダリングの精度の競争力または優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-14T18:18:32Z) - DK-SLAM: Monocular Visual SLAM with Deep Keypoint Learning, Tracking and Loop-Closing [13.50980509878613]
公開されているデータセットに対する実験的評価は、DK-SLAMが従来のSLAMシステムと学習ベースのSLAMシステムより優れていることを示している。
本システムでは,キーポイント抽出ネットワークの学習を最適化するために,モデル非依存メタラーニング(MAML)戦略を採用している。
累積的な位置決め誤差を軽減するため、DK-SLAMはループ閉鎖検出にバイナリ機能を利用する新しいオンライン学習モジュールを組み込んだ。
論文 参考訳(メタデータ) (2024-01-17T12:08:30Z) - LSGDDN-LCD: An Appearance-based Loop Closure Detection using Local
Superpixel Grid Descriptors and Incremental Dynamic Nodes [0.0]
ループクロージャ検出(LCD)は、視覚的同時ローカライゼーションとマッピング(SLAM)システムにおいて欠かせない要素である。
本稿では,ローカルなスーパーピクセルグリッド記述子と動的ノードを用いたオンライン表示型LCDを提案する。
論文 参考訳(メタデータ) (2023-04-08T00:00:05Z) - PLD-SLAM: A Real-Time Visual SLAM Using Points and Line Segments in
Dynamic Scenes [0.0]
本稿では,点と線の特徴を組み合わせたリアルタイムステレオ間接視覚SLAMシステム PLD-SLAMを提案する。
また,適切な選択と効率的なループ閉鎖検出を実現するため,グローバルグレー類似度(GGS)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-22T07:40:00Z) - The CLEAR Benchmark: Continual LEArning on Real-World Imagery [77.98377088698984]
連続学習(CL)は、生涯AIにとって重要な課題であると考えられている。
本稿では,視覚概念の自然な時間進化を伴う最初の連続画像分類ベンチマークであるCLEARを紹介する。
単純な教師なし事前学習のステップで、最先端のCLアルゴリズムがすでに強化されていることが分かりました。
論文 参考訳(メタデータ) (2022-01-17T09:09:09Z) - LCDNet: Deep Loop Closure Detection for LiDAR SLAM based on Unbalanced
Optimal Transport [8.21384946488751]
LiDAR ポイント クラウドのループ クロージャを効果的に検出する新しい LCDNet を紹介します。
LCDNetは、共有エンコーダ、グローバルディスクリプタを抽出する場所認識ヘッド、および2つの点雲間の変換を推定する相対ポーズヘッドで構成されています。
私たちのアプローチは、逆ループを扱う場合でも、最先端の技術を大きなマージンで上回る。
論文 参考訳(メタデータ) (2021-03-08T20:19:37Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。