論文の概要: MoD-SLAM: Monocular Dense Mapping for Unbounded 3D Scene Reconstruction
- arxiv url: http://arxiv.org/abs/2402.03762v5
- Date: Fri, 8 Mar 2024 18:42:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 22:33:12.779014
- Title: MoD-SLAM: Monocular Dense Mapping for Unbounded 3D Scene Reconstruction
- Title(参考訳): mod-slam:unbounded 3d scene reconstructionのための単眼高密度マッピング
- Authors: Heng Zhou, Zhetao Guo, Shuhong Liu, Lechen Zhang, Qihao Wang, Yuxiang
Ren, Mingrui Li
- Abstract要約: MoD-SLAMは、非有界シーンにおけるリアルタイムな3次元再構成を可能にする、最初のモノクラーNeRFを用いた高密度マッピング法である。
追跡処理にロバストな深度損失項を導入することにより,大規模シーンにおけるより正確なポーズ推定を実現する。
2つの標準データセットを用いた実験により, MoD-SLAMは競争性能を向上し, 3次元再構成の精度を最大30%, 15%向上した。
- 参考スコア(独自算出の注目度): 2.3630527334737104
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular SLAM has received a lot of attention due to its simple RGB inputs
and the lifting of complex sensor constraints. However, existing monocular SLAM
systems are designed for bounded scenes, restricting the applicability of SLAM
systems. To address this limitation, we propose MoD-SLAM, the first monocular
NeRF-based dense mapping method that allows 3D reconstruction in real-time in
unbounded scenes. Specifically, we introduce a Gaussian-based unbounded scene
representation approach to solve the challenge of mapping scenes without
boundaries. This strategy is essential to extend the SLAM application.
Moreover, a depth estimation module in the front-end is designed to extract
accurate priori depth values to supervise mapping and tracking processes. By
introducing a robust depth loss term into the tracking process, our SLAM system
achieves more precise pose estimation in large-scale scenes. Our experiments on
two standard datasets show that MoD-SLAM achieves competitive performance,
improving the accuracy of the 3D reconstruction and localization by up to 30%
and 15% respectively compared with existing state-of-the-art monocular SLAM
systems.
- Abstract(参考訳): 単分子SLAMは、シンプルなRGB入力と複雑なセンサー制約の解除により、多くの注目を集めている。
しかし、既存の単分子SLAMシステムは境界シーン用に設計されており、SLAMシステムの適用性を制限している。
この制限に対処するために,非有界シーンでリアルタイムに3次元再構成を可能にする最初の単眼型nerfベースの密集マッピング手法であるmod-slamを提案する。
具体的には,境界のないシーンをマッピングする課題を解決するために,ガウス型無境界シーン表現手法を導入する。
この戦略はSLAMアプリケーションを拡張するために不可欠です。
さらに、フロントエンドの深さ推定モジュールは、正確な事前深度値を抽出してマッピングと追跡プロセスを監督するように設計されている。
追跡処理にロバストな深度損失項を導入することにより,大規模シーンにおけるより正確なポーズ推定を実現する。
2つの標準データセットを用いた実験により,mod-slamは,既存のモノクロスラムシステムと比較して,最大30%,15%の精度向上と3次元再構成の精度向上を実現した。
関連論文リスト
- Q-SLAM: Quadric Representations for Monocular SLAM [89.05457684629621]
モノクラーSLAMは、3Dジオメトリを正確にモデル化するという課題に長い間取り組んできた。
ニューラルラジアンス場(NeRF)をベースとしたモノキュラーSLAMの最近の進歩は、将来性を示している。
本稿では,2次形式のレンズを通して体積表現を再現する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-12T23:27:30Z) - SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM [50.60694084264132]
3Dガウシアンによるシーンの表現は、単一の単眼のRGB-Dカメラを用いて高密度SLAMを実現することができることを示す。
私たちはオンラインのトラッキングとマッピングのパイプラインを採用し、基礎となるガウス表現を特に使用するように調整しています。
実験により、SplaTAMは、カメラポーズ推定、マップ構築、ノベルビュー合成において、最先端の性能を最大2倍に向上することが示された。
論文 参考訳(メタデータ) (2023-12-04T18:53:24Z) - NICER-SLAM: Neural Implicit Scene Encoding for RGB SLAM [111.83168930989503]
NICER-SLAMは、カメラポーズと階層的なニューラル暗黙マップ表現を同時に最適化するRGB SLAMシステムである。
近年のRGB-D SLAMシステムと競合する高密度マッピング,追跡,新しいビュー合成において,高い性能を示す。
論文 参考訳(メタデータ) (2023-02-07T17:06:34Z) - ESLAM: Efficient Dense SLAM System Based on Hybrid Representation of
Signed Distance Fields [2.0625936401496237]
ESLAMは、未知のカメラポーズでRGB-Dフレームを読み出し、シーン表現を漸進的に再構築する。
ESLAMは3次元再構成の精度を向上し、最先端の高密度視覚SLAM法のカメラローカライゼーションを50%以上向上する。
論文 参考訳(メタデータ) (2022-11-21T18:25:14Z) - NICE-SLAM: Neural Implicit Scalable Encoding for SLAM [112.6093688226293]
NICE-SLAMは階層的なシーン表現を導入することでマルチレベルローカル情報を組み込んだ高密度SLAMシステムである。
最近の暗黙的SLAMシステムと比較して、私たちのアプローチはよりスケーラブルで効率的で堅牢です。
論文 参考訳(メタデータ) (2021-12-22T18:45:44Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - DSP-SLAM: Object Oriented SLAM with Deep Shape Priors [16.867669408751507]
対象物に対する高密度3次元モデルのリッチで正確な関節マップを構築するオブジェクト指向SLAMシステムを提案する。
DSP-SLAMは特徴ベースのSLAMシステムによって再構築された3Dポイントクラウドを入力として取り込む。
本評価では,近年の深層構造復元法に対して,物体の姿勢と形状の復元が改善したことを示す。
論文 参考訳(メタデータ) (2021-08-21T10:00:12Z) - CodeMapping: Real-Time Dense Mapping for Sparse SLAM using Compact Scene
Representations [20.79223452551813]
最先端の疎視的SLAMシステムは、カメラの軌跡とランドマークの位置を正確に推定する。
これらのスパースマップは、ローカライゼーションに有用であるが、障害物回避やシーン理解といった他のタスクには使用できない。
本稿では、カメラのポーズやスパースポイントを入力として捉えた疎視的SLAMシステムを補完する高密度マッピングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-19T16:13:18Z) - Improved Real-Time Monocular SLAM Using Semantic Segmentation on
Selective Frames [15.455647477995312]
先進的運転支援システムと自律運転システムでは単眼同時位置決めマッピング(slam)が登場している。
本稿では,深層学習に基づくセマンティックセグメンテーションを用いたリアルタイム一眼SLAMの改良を提案する。
6本の映像列を用いた実験により,提案方式により精度の高い軌道追尾精度が得られた。
論文 参考訳(メタデータ) (2021-04-30T22:34:45Z) - Pseudo RGB-D for Self-Improving Monocular SLAM and Depth Prediction [72.30870535815258]
モノクロ深度予測のためのCNNは、周囲の環境の3Dマップを構築するための2つの大きく不連続なアプローチを表している。
本稿では,CNN予測深度を利用してRGB-D特徴量に基づくSLAMを行う,狭義の広義の自己改善フレームワークを提案する。
一方、より原理化された幾何学的SLAMの3次元シーン構造とカメラポーズは、新しい広義のベースライン損失により奥行きネットワークに注入される。
論文 参考訳(メタデータ) (2020-04-22T16:31:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。