論文の概要: OV$^{2}$SLAM : A Fully Online and Versatile Visual SLAM for Real-Time
Applications
- arxiv url: http://arxiv.org/abs/2102.04060v1
- Date: Mon, 8 Feb 2021 08:39:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:25:09.399647
- Title: OV$^{2}$SLAM : A Fully Online and Versatile Visual SLAM for Real-Time
Applications
- Title(参考訳): OV$^{2}$SLAM : リアルタイムアプリケーションのための完全かつ汎用的なビジュアルSLAM
- Authors: Maxime Ferrera, Alexandre Eudes, Julien Moras, Martial Sanfourche, Guy
Le Besnerais
- Abstract要約: OV$2$SLAMは、モノクロカメラとステレオカメラの両方のセットアップ、さまざまなマップスケール、フレームレートを、数ヘルツから数百まで、完全にオンラインのアルゴリズムである。
コミュニティの利益のために、ソースコードを urlhttps://github.com/ov2slam/ov2slam でリリースします。
- 参考スコア(独自算出の注目度): 59.013743002557646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many applications of Visual SLAM, such as augmented reality, virtual reality,
robotics or autonomous driving, require versatile, robust and precise
solutions, most often with real-time capability. In this work, we describe
OV$^{2}$SLAM, a fully online algorithm, handling both monocular and stereo
camera setups, various map scales and frame-rates ranging from a few Hertz up
to several hundreds. It combines numerous recent contributions in visual
localization within an efficient multi-threaded architecture. Extensive
comparisons with competing algorithms shows the state-of-the-art accuracy and
real-time performance of the resulting algorithm. For the benefit of the
community, we release the source code:
\url{https://github.com/ov2slam/ov2slam}.
- Abstract(参考訳): 拡張現実、仮想現実、ロボティクス、自律運転など、多くのVisual SLAMのアプリケーションは、多用途で堅牢で正確なソリューションを必要とし、多くの場合、リアルタイムな機能を備えている。
本稿では,完全オンラインアルゴリズムであるov$^{2}$slamについて述べる。単眼カメラとステレオカメラのセットアップ,数ヘルツから数百ヘルツまでの様々な地図スケールとフレームレートを扱う。
効率的なマルチスレッドアーキテクチャ内での視覚的ローカリゼーションにおける最近の多数の貢献を組み合わせている。
競合するアルゴリズムとの広範な比較は、得られたアルゴリズムの最先端の精度とリアルタイム性能を示している。
コミュニティの利益のために、ソースコード: \url{https://github.com/ov2slam/ov2slam}をリリースします。
関連論文リスト
- MAGiC-SLAM: Multi-Agent Gaussian Globally Consistent SLAM [23.318966306555915]
同時ローカライゼーションとマッピング(SLAM)システムは、拡張現実、ロボティクス、自律運転など、コンピュータビジョンで広く使われている。
近年の研究では、分散ニューラルシーン表現を用いてこの問題に対処している。
本稿では,厳格に変形可能な3次元ガウス型シーン表現を提案する。
合成および実世界のデータセット上でMAGiC-SLAMを評価し,その精度と精度について検討した。
論文 参考訳(メタデータ) (2024-11-25T08:34:01Z) - Coarse Correspondences Boost Spatial-Temporal Reasoning in Multimodal Language Model [51.83436609094658]
本稿では,2次元画像を入力として,MLLMの時空間推論を強化する軽量な手法である粗対応を導入する。
本手法は,映像のフレーム間や異なる視点における主物体の対応性を特定するために,軽量な追跡モデルを用いている。
この単純なトレーニングフリーアプローチは、4つのベンチマークでGPT4-V/Oに一定の利得をもたらすことを実証する。
論文 参考訳(メタデータ) (2024-08-01T17:57:12Z) - Multicam-SLAM: Non-overlapping Multi-camera SLAM for Indirect Visual Localization and Navigation [1.3654846342364308]
本稿では,複数のRGB-Dカメラを用いた視覚的同時ローカライゼーションとマッピング(SLAM)の新たなアプローチを提案する。
提案手法であるMulticam-SLAMはSLAMシステムの堅牢性と精度を大幅に向上させる。
従来の単一カメラSLAMシステムと比較して, 提案手法の精度とロバスト性は良好であった。
論文 参考訳(メタデータ) (2024-06-10T15:36:23Z) - NGD-SLAM: Towards Real-Time Dynamic SLAM without GPU [4.959552873584984]
本稿では,マスク予測機構を組み込んだオープンソースのリアルタイム動的SLAMシステムを提案する。
本システムは,ラップトップCPU上でのトラッキングフレームレート56FPSを実現しつつ,動的環境における高いローカライズ精度を維持している。
論文 参考訳(メタデータ) (2024-05-12T23:00:53Z) - VMamba: Visual State Space Model [92.83984290020891]
VMambaは、線形時間複雑性で動作するビジョンバックボーンである。
VMambaのコアには2D Selective Scan (SS2D)モジュールを備えたVisual State-Space (VSS)ブロックのスタックがある。
論文 参考訳(メタデータ) (2024-01-18T17:55:39Z) - EvaSurf: Efficient View-Aware Implicit Textured Surface Reconstruction on Mobile Devices [53.28220984270622]
モバイル端末に暗黙的テクスチャを付加したtextbfSurf$ace 再構成手法を提案する。
提案手法は,合成と実世界の両方のデータセット上で,高品質な外観と正確なメッシュを再構築することができる。
我々の方法は1つのGPUを使ってたった1~2時間でトレーニングでき、40FPS(Frames per second)以上のモバイルデバイス上で実行することができる。
論文 参考訳(メタデータ) (2023-11-16T11:30:56Z) - Shelving, Stacking, Hanging: Relational Pose Diffusion for Multi-modal
Rearrangement [49.888011242939385]
本研究では,シーン内のオブジェクトを並べ替えて,所望のオブジェクトとシーンの配置関係を実現するシステムを提案する。
パイプラインは、新しいジオメトリ、ポーズ、シーンとオブジェクトのレイアウトに一般化される。
論文 参考訳(メタデータ) (2023-07-10T17:56:06Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - Keeping Less is More: Point Sparsification for Visual SLAM [1.370633147306388]
本研究では,SLAMシステムにおける地図点のスペース化のための効率的なグラフ最適化を提案する。
具体的には、最小コストの最大フローグラフ最適化問題として、最大ポーズ可視性と最大空間多様性問題を定式化する。
提案手法は既存のSLAMシステムの追加ステップとして機能し,従来のSLAMシステムと学習ベースのSLAMシステムの両方で使用することができる。
論文 参考訳(メタデータ) (2022-07-01T06:39:38Z) - DXSLAM: A Robust and Efficient Visual SLAM System with Deep Features [5.319556638040589]
本稿では、深層畳み込みニューラルネットワーク(CNN)による特徴抽出を、現代のSLAMフレームワークにシームレスに組み込むことができることを示す。
提案システムでは,最新のCNNを用いて各画像フレーム内のキーポイントを検出し,キーポイント記述子だけでなく,全体像のグローバル記述子も提供する。
論文 参考訳(メタデータ) (2020-08-12T16:14:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。