論文の概要: DXSLAM: A Robust and Efficient Visual SLAM System with Deep Features
- arxiv url: http://arxiv.org/abs/2008.05416v1
- Date: Wed, 12 Aug 2020 16:14:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 05:59:42.864247
- Title: DXSLAM: A Robust and Efficient Visual SLAM System with Deep Features
- Title(参考訳): DXSLAM: 深い機能を備えたロバストで効率的なビジュアルSLAMシステム
- Authors: Dongjiang Li, Xuesong Shi, Qiwei Long, Shenghui Liu, Wei Yang, Fangshi
Wang, Qi Wei, Fei Qiao
- Abstract要約: 本稿では、深層畳み込みニューラルネットワーク(CNN)による特徴抽出を、現代のSLAMフレームワークにシームレスに組み込むことができることを示す。
提案システムでは,最新のCNNを用いて各画像フレーム内のキーポイントを検出し,キーポイント記述子だけでなく,全体像のグローバル記述子も提供する。
- 参考スコア(独自算出の注目度): 5.319556638040589
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A robust and efficient Simultaneous Localization and Mapping (SLAM) system is
essential for robot autonomy. For visual SLAM algorithms, though the
theoretical framework has been well established for most aspects, feature
extraction and association is still empirically designed in most cases, and can
be vulnerable in complex environments. This paper shows that feature extraction
with deep convolutional neural networks (CNNs) can be seamlessly incorporated
into a modern SLAM framework. The proposed SLAM system utilizes a
state-of-the-art CNN to detect keypoints in each image frame, and to give not
only keypoint descriptors, but also a global descriptor of the whole image.
These local and global features are then used by different SLAM modules,
resulting in much more robustness against environmental changes and viewpoint
changes compared with using hand-crafted features. We also train a visual
vocabulary of local features with a Bag of Words (BoW) method. Based on the
local features, global features, and the vocabulary, a highly reliable loop
closure detection method is built. Experimental results show that all the
proposed modules significantly outperforms the baseline, and the full system
achieves much lower trajectory errors and much higher correct rates on all
evaluated data. Furthermore, by optimizing the CNN with Intel OpenVINO toolkit
and utilizing the Fast BoW library, the system benefits greatly from the SIMD
(single-instruction-multiple-data) techniques in modern CPUs. The full system
can run in real-time without any GPU or other accelerators. The code is public
at https://github.com/ivipsourcecode/dxslam.
- Abstract(参考訳): ロボットの自律性にはロバストで効率的な同時ローカライゼーション・マッピング(slam)システムが不可欠である。
ビジュアルSLAMアルゴリズムについては、ほとんどの面において理論的な枠組みが確立されているが、機能抽出とアソシエーションはいまだに実証的に設計されており、複雑な環境では脆弱である。
本稿では、深層畳み込みニューラルネットワーク(CNN)による特徴抽出を、現代のSLAMフレームワークにシームレスに組み込むことができることを示す。
提案システムでは,最新のCNNを用いて各画像フレーム内のキーポイントを検出し,キーポイント記述子だけでなく,全体像のグローバル記述子も提供する。
これらのローカルおよびグローバル機能は、異なるslamモジュールによって使用されるため、手作りの機能よりも環境変化や視点変化に対する堅牢性が向上する。
また,Bag of Words (BoW) 法を用いて局所特徴の視覚語彙を訓練する。
局所的な特徴,グローバルな特徴,語彙に基づいて,信頼性の高いループクロージャ検出手法を構築した。
実験の結果,提案するモジュールはベースラインを著しく上回っており,全システムでは軌道誤差が大幅に低く,評価されたデータに対して精度が高かった。
さらに、CNNをIntel OpenVINOツールキットで最適化し、Fast BoWライブラリを活用することにより、現代のCPUにおけるSIMD(シングルインストラクション・マルチプルデータ)技術から大いに恩恵を受ける。
フルシステムはGPUや他のアクセラレータなしでリアルタイムに実行できる。
コードはhttps://github.com/ivipsourcecode/dxslam.comで公開されている。
関連論文リスト
- Self-Organizing Edge Computing Distribution Framework for Visual SLAM [0.6749750044497732]
本稿では,デバイスネットワーク上で完全に分散されたSLAM実行を自己組織化できる新しいエッジ支援SLAMフレームワークを提案する。
アーキテクチャは3つのレイヤで構成されており、デバイスに依存しず、ネットワーク障害に対して回復力があり、コアSLAMシステムに最小限の侵入力を持つように設計されている。
論文 参考訳(メタデータ) (2025-01-15T07:24:15Z) - Loopy-SLAM: Dense Neural SLAM with Loop Closures [53.11936461015725]
ポーズをグローバルに最適化するLoopy-SLAMと高密度3Dモデルを導入する。
我々は,データ駆動のポイントベースサブマップ生成手法を用いてフレーム・ツー・モデル追跡を行い,グローバルな位置認識を行うことで,オンラインのループクロージャをトリガーする。
合成Replicaおよび実世界のTUM-RGBDおよびScanNetデータセットの評価は、既存の高密度ニューラルネットワークRGBD SLAM法と比較して、追跡、マッピング、レンダリングの精度の競争力または優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-14T18:18:32Z) - DK-SLAM: Monocular Visual SLAM with Deep Keypoint Learning, Tracking and Loop-Closing [13.50980509878613]
公開されているデータセットに対する実験的評価は、DK-SLAMが従来のSLAMシステムと学習ベースのSLAMシステムより優れていることを示している。
本システムでは,キーポイント抽出ネットワークの学習を最適化するために,モデル非依存メタラーニング(MAML)戦略を採用している。
累積的な位置決め誤差を軽減するため、DK-SLAMはループ閉鎖検出にバイナリ機能を利用する新しいオンライン学習モジュールを組み込んだ。
論文 参考訳(メタデータ) (2024-01-17T12:08:30Z) - PIN-SLAM: LiDAR SLAM Using a Point-Based Implicit Neural Representation for Achieving Global Map Consistency [30.5868776990673]
PIN-SLAMは、弾性的かつコンパクトな点ベースの暗黙的ニューラルマップ表現に基づいて、一貫した一貫したマップを構築するシステムである。
我々の暗黙の地図は、ループを閉じる際の大域的なポーズ調整とともに、本質的に弾性で変形可能なスパース最適化可能なニューラルポイントに基づいている。
PIN-SLAMは、最先端のLiDARオドメトリーやSLAMシステムと同等のポーズ推定精度を達成する。
論文 参考訳(メタデータ) (2024-01-17T10:06:12Z) - Using Detection, Tracking and Prediction in Visual SLAM to Achieve
Real-time Semantic Mapping of Dynamic Scenarios [70.70421502784598]
RDS-SLAMは、一般的に使用されているIntel Core i7 CPUのみを使用して、動的シナリオのためのオブジェクトレベルでのセマンティックマップをリアルタイムで構築することができる。
我々は, TUM RGB-DデータセットにおけるRDS-SLAMを評価し, 動的シナリオにおいて, RDS-SLAMはフレームあたり30.3msで動作可能であることを示した。
論文 参考訳(メタデータ) (2022-10-10T11:03:32Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - NICE-SLAM: Neural Implicit Scalable Encoding for SLAM [112.6093688226293]
NICE-SLAMは階層的なシーン表現を導入することでマルチレベルローカル情報を組み込んだ高密度SLAMシステムである。
最近の暗黙的SLAMシステムと比較して、私たちのアプローチはよりスケーラブルで効率的で堅牢です。
論文 参考訳(メタデータ) (2021-12-22T18:45:44Z) - Greedy-Based Feature Selection for Efficient LiDAR SLAM [12.257338124961622]
本論文では,L-SLAMシステムの精度と効率を,機能のサブセットを積極的に選択することで大幅に向上できることを実証する。
提案手法は,最先端のL-SLAMシステムと比較して,ローカライズ誤差と高速化が低いことを示す。
論文 参考訳(メタデータ) (2021-03-24T11:03:16Z) - OV$^{2}$SLAM : A Fully Online and Versatile Visual SLAM for Real-Time
Applications [59.013743002557646]
OV$2$SLAMは、モノクロカメラとステレオカメラの両方のセットアップ、さまざまなマップスケール、フレームレートを、数ヘルツから数百まで、完全にオンラインのアルゴリズムである。
コミュニティの利益のために、ソースコードを urlhttps://github.com/ov2slam/ov2slam でリリースします。
論文 参考訳(メタデータ) (2021-02-08T08:39:23Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。