論文の概要: DK-SLAM: Monocular Visual SLAM with Deep Keypoint Learning, Tracking and Loop-Closing
- arxiv url: http://arxiv.org/abs/2401.09160v2
- Date: Tue, 25 Jun 2024 04:15:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-26 20:40:18.174676
- Title: DK-SLAM: Monocular Visual SLAM with Deep Keypoint Learning, Tracking and Loop-Closing
- Title(参考訳): DK-SLAM:Deep Keypoint Learning, Tracking and Loop-Closingを備えた単眼視覚SLAM
- Authors: Hao Qu, Lilian Zhang, Jun Mao, Junbo Tie, Xiaofeng He, Xiaoping Hu, Yifei Shi, Changhao Chen,
- Abstract要約: 公開されているデータセットに対する実験的評価は、DK-SLAMが従来のSLAMシステムと学習ベースのSLAMシステムより優れていることを示している。
本システムでは,キーポイント抽出ネットワークの学習を最適化するために,モデル非依存メタラーニング(MAML)戦略を採用している。
累積的な位置決め誤差を軽減するため、DK-SLAMはループ閉鎖検出にバイナリ機能を利用する新しいオンライン学習モジュールを組み込んだ。
- 参考スコア(独自算出の注目度): 13.50980509878613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The performance of visual SLAM in complex, real-world scenarios is often compromised by unreliable feature extraction and matching when using handcrafted features. Although deep learning-based local features excel at capturing high-level information and perform well on matching benchmarks, they struggle with generalization in continuous motion scenes, adversely affecting loop detection accuracy. Our system employs a Model-Agnostic Meta-Learning (MAML) strategy to optimize the training of keypoint extraction networks, enhancing their adaptability to diverse environments. Additionally, we introduce a coarse-to-fine feature tracking mechanism for learned keypoints. It begins with a direct method to approximate the relative pose between consecutive frames, followed by a feature matching method for refined pose estimation. To mitigate cumulative positioning errors, DK-SLAM incorporates a novel online learning module that utilizes binary features for loop closure detection. This module dynamically identifies loop nodes within a sequence, ensuring accurate and efficient localization. Experimental evaluations on publicly available datasets demonstrate that DK-SLAM outperforms leading traditional and learning based SLAM systems, such as ORB-SLAM3 and LIFT-SLAM. These results underscore the efficacy and robustness of our DK-SLAM in varied and challenging real-world environments.
- Abstract(参考訳): 複雑で現実的なシナリオにおける視覚的SLAMの性能は、しばしば手作りの特徴を使用する際に、信頼性の低い特徴抽出とマッチングによって損なわれる。
深層学習に基づく局所的特徴は、高レベル情報を捕捉し、マッチングベンチマークでよく機能するが、連続的な動きシーンの一般化に苦慮し、ループ検出精度に悪影響を及ぼす。
本システムでは,キーポイント抽出ネットワークの学習を最適化し,多様な環境への適応性を高めるため,モデル非依存メタラーニング(MAML)戦略を採用している。
さらに,学習キーポイントに対する粗い特徴追跡機構を導入する。
これは、連続するフレーム間の相対的なポーズを近似する直接法から始まり、続いて洗練されたポーズ推定のための特徴マッチング法が続く。
累積的な位置決め誤差を軽減するため、DK-SLAMはループ閉鎖検出にバイナリ機能を利用する新しいオンライン学習モジュールを組み込んだ。
このモジュールはシーケンス内のループノードを動的に識別し、正確かつ効率的なローカライゼーションを保証する。
DK-SLAMは、ORB-SLAM3やLIFT-SLAMといった従来の学習ベースのSLAMシステムよりも優れています。
これらの結果は,実環境におけるDK-SLAMの有効性とロバスト性を示すものである。
関連論文リスト
- Self-Supervised Geometry-Guided Initialization for Robust Monocular Visual Odometry [9.79428015716139]
本稿では,屋外ベンチマークにおける主要な障害事例を分析し,学習ベースSLAMモデル(DROID-SLAM)の欠点を明らかにする。
本研究では, 凍結した大規模単分子深度推定を利用して, 密集束調整過程を初期化する自己教師付き事前計算手法を提案する。
その単純さにもかかわらず,提案手法は, DDADベンチマークと同様に, KITTIオドメトリーの大幅な改善を示す。
論文 参考訳(メタデータ) (2024-06-03T01:59:29Z) - NGD-SLAM: Towards Real-Time Dynamic SLAM without GPU [4.959552873584984]
本稿では,マスク予測機構を組み込んだオープンソースのリアルタイム動的SLAMシステムを提案する。
本システムは,ラップトップCPU上でのトラッキングフレームレート56FPSを実現しつつ,動的環境における高いローカライズ精度を維持している。
論文 参考訳(メタデータ) (2024-05-12T23:00:53Z) - LEAP-VO: Long-term Effective Any Point Tracking for Visual Odometry [52.131996528655094]
本稿では,LEAP(Long-term Effective Any Point Tracking)モジュールについて述べる。
LEAPは、動的トラック推定のために、視覚的、トラック間、時間的キューと慎重に選択されたアンカーを革新的に組み合わせている。
これらの特徴に基づき,強靭な視力計測システムLEAP-VOを開発した。
論文 参考訳(メタデータ) (2024-01-03T18:57:27Z) - DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - UncLe-SLAM: Uncertainty Learning for Dense Neural SLAM [60.575435353047304]
我々は、高密度ニューラルネットワークの同時局所化とマッピング(SLAM)のための不確実性学習フレームワークを提案する。
本稿では,2次元入力データのみから自己教師付きで学習可能なセンサ不確実性推定のためのオンラインフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T16:26:25Z) - Point-SLAM: Dense Neural Point Cloud-based SLAM [61.96492935210654]
本稿では,モノクラーRGBD入力に対する高密度ニューラルネットワークの局所化とマッピング(SLAM)手法を提案する。
トラッキングとマッピングの両方が、同じポイントベースのニューラルシーン表現で実行可能であることを実証する。
論文 参考訳(メタデータ) (2023-04-09T16:48:26Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - PLD-SLAM: A Real-Time Visual SLAM Using Points and Line Segments in
Dynamic Scenes [0.0]
本稿では,点と線の特徴を組み合わせたリアルタイムステレオ間接視覚SLAMシステム PLD-SLAMを提案する。
また,適切な選択と効率的なループ閉鎖検出を実現するため,グローバルグレー類似度(GGS)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-22T07:40:00Z) - LIFT-SLAM: a deep-learning feature-based monocular visual SLAM method [0.0]
従来のジオメトリベースのVSLAMと深層学習に基づく特徴記述子の可能性を組み合わせることを提案する。
KITTIとEurocのデータセットを用いた実験では、ディープラーニングが従来のVSLAMシステムの性能向上に有効であることが示されている。
論文 参考訳(メタデータ) (2021-03-31T20:35:10Z) - DXSLAM: A Robust and Efficient Visual SLAM System with Deep Features [5.319556638040589]
本稿では、深層畳み込みニューラルネットワーク(CNN)による特徴抽出を、現代のSLAMフレームワークにシームレスに組み込むことができることを示す。
提案システムでは,最新のCNNを用いて各画像フレーム内のキーポイントを検出し,キーポイント記述子だけでなく,全体像のグローバル記述子も提供する。
論文 参考訳(メタデータ) (2020-08-12T16:14:46Z) - Learning to Explore using Active Neural SLAM [99.42064696897533]
この研究は、3D環境を探索するポリシーを学ぶためのモジュラーで階層的なアプローチを示す。
提案されたモデルはPointGoalタスクに簡単に移行することができ、CVPR 2019 Habitat PointGoal Navigation Challengeの勝者となった。
論文 参考訳(メタデータ) (2020-04-10T17:57:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。