論文の概要: iMAP: Implicit Mapping and Positioning in Real-Time
- arxiv url: http://arxiv.org/abs/2103.12352v1
- Date: Tue, 23 Mar 2021 07:21:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-24 13:53:35.343376
- Title: iMAP: Implicit Mapping and Positioning in Real-Time
- Title(参考訳): iMAP:リアルタイムの入射マッピングと位置決め
- Authors: Edgar Sucar, Shikun Liu, Joseph Ortiz, Andrew J. Davison
- Abstract要約: ハンドヘルドRGB-DカメラのリアルタイムSLAMシステムにおいて,マルチ層パーセプトロン(MLP)が唯一のシーン表現として機能することを示す。
われわれのネットワークは、事前のデータを使わずに、ライブ操作で訓練され、集中した、シーン固有の暗黙の3dモデルを構築します。
- 参考スコア(独自算出の注目度): 25.1623315489284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We show for the first time that a multilayer perceptron (MLP) can serve as
the only scene representation in a real-time SLAM system for a handheld RGB-D
camera. Our network is trained in live operation without prior data, building a
dense, scene-specific implicit 3D model of occupancy and colour which is also
immediately used for tracking.
Achieving real-time SLAM via continual training of a neural network against a
live image stream requires significant innovation. Our iMAP algorithm uses a
keyframe structure and multi-processing computation flow, with dynamic
information-guided pixel sampling for speed, with tracking at 10 Hz and global
map updating at 2 Hz. The advantages of an implicit MLP over standard dense
SLAM techniques include efficient geometry representation with automatic detail
control and smooth, plausible filling-in of unobserved regions such as the back
surfaces of objects.
- Abstract(参考訳): ハンドヘルドRGB-DカメラのリアルタイムSLAMシステムにおいて,マルチ層パーセプトロン(MLP)が唯一のシーン表現として機能することを示す。
われわれのネットワークは、事前のデータを使わずに、ライブ操作で訓練され、集中した、シーン固有の暗黙の3dモデルを構築します。
ライブ画像ストリームに対するニューラルネットワークの継続的なトレーニングによるリアルタイムslamの実現には,大幅なイノベーションが必要だ。
我々のiMAPアルゴリズムはキーフレーム構造とマルチプロセスの計算フローを使い、動的情報誘導ピクセルサンプリングにより速度を10Hzで追跡し、グローバルマップを2Hzで更新する。
標準的な高密度SLAM技術よりも暗黙的なMLPの利点は、自動細部制御による効率的な幾何表現と、物体の裏面のような観測されていない領域の滑らかで可視な埋め込みである。
関連論文リスト
- SP-SLAM: Neural Real-Time Dense SLAM With Scene Priors [32.42183561158492]
本稿では,SP-SLAMを提案する。SP-SLAMは,リアルタイムにトラッキングとマッピングを行う新しいRGB-D SLAMシステムである。
SP-SLAMでは,実行中のすべての過去の入力フレームのポーズを連続的に最適化する,マッピングの効果的な最適化戦略を導入する。
その結果, 従来の手法と比較して, 高速に動作しながら, トラッキング精度, 復元精度が向上していることがわかった。
論文 参考訳(メタデータ) (2025-01-11T07:53:58Z) - MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。
我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。
また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文 参考訳(メタデータ) (2024-04-01T04:57:41Z) - DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - ESLAM: Efficient Dense SLAM System Based on Hybrid Representation of
Signed Distance Fields [2.0625936401496237]
ESLAMは、未知のカメラポーズでRGB-Dフレームを読み出し、シーン表現を漸進的に再構築する。
ESLAMは3次元再構成の精度を向上し、最先端の高密度視覚SLAM法のカメラローカライゼーションを50%以上向上する。
論文 参考訳(メタデータ) (2022-11-21T18:25:14Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。