論文の概要: GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction
- arxiv url: http://arxiv.org/abs/2309.02436v1
- Date: Tue, 5 Sep 2023 17:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 13:35:50.695740
- Title: GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction
- Title(参考訳): go-slam:一貫性のある3次元インスタントリコンストラクションのためのグローバル最適化
- Authors: Youmin Zhang, Fabio Tosi, Stefano Mattoccia, Matteo Poggi
- Abstract要約: GO-SLAMは、リアルタイムでポーズと3D再構成をグローバルに最適化するディープラーニングベースの高密度ビジュアルSLAMフレームワークである。
さまざまな合成および実世界のデータセットの結果から、GO-SLAMはロバスト性や復元精度の追跡において最先端のアプローチよりも優れていることが示されている。
- 参考スコア(独自算出の注目度): 45.49960166785063
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural implicit representations have recently demonstrated compelling results
on dense Simultaneous Localization And Mapping (SLAM) but suffer from the
accumulation of errors in camera tracking and distortion in the reconstruction.
Purposely, we present GO-SLAM, a deep-learning-based dense visual SLAM
framework globally optimizing poses and 3D reconstruction in real-time. Robust
pose estimation is at its core, supported by efficient loop closing and online
full bundle adjustment, which optimize per frame by utilizing the learned
global geometry of the complete history of input frames. Simultaneously, we
update the implicit and continuous surface representation on-the-fly to ensure
global consistency of 3D reconstruction. Results on various synthetic and
real-world datasets demonstrate that GO-SLAM outperforms state-of-the-art
approaches at tracking robustness and reconstruction accuracy. Furthermore,
GO-SLAM is versatile and can run with monocular, stereo, and RGB-D input.
- Abstract(参考訳): ニューラルな暗黙表現は近年、高密度な局所化とマッピング(SLAM)において魅力的な結果を示しているが、カメラ追跡における誤差の蓄積と再構成における歪みに悩まされている。
目的〕GO-SLAMは,リアルタイムにポーズと3D再構成をグローバルに最適化するディープラーニングベースの高密度視覚SLAMフレームワークである。
ロバストポーズ推定は、効率的なループ閉包とオンラインフルバンドル調整によって支援され、入力フレームの完全な履歴の学習された大域的幾何を利用して、フレームごとの最適化を行う。
同時に, 暗黙的かつ連続的な表面表現をオンザフライで更新し, 全体的な3次元再構成の一貫性を確保する。
様々な合成データと実世界のデータセットの結果から、go-slamは堅牢性と再構成精度を追跡する最先端のアプローチよりも優れていることが示されている。
さらにGO-SLAMは汎用的で、単分子、ステレオ、RGB-D入力で動作可能である。
関連論文リスト
- Splat-SLAM: Globally Optimized RGB-only SLAM with 3D Gaussians [87.48403838439391]
3D Splattingは、RGBのみの高密度SLAMの幾何学と外観の強力な表現として登場した。
本稿では,高密度な3次元ガウス写像表現を持つRGBのみのSLAMシステムを提案する。
Replica、TUM-RGBD、ScanNetのデータセットに対する実験は、グローバルに最適化された3Dガウスの有効性を示している。
論文 参考訳(メタデータ) (2024-05-26T12:26:54Z) - NeSLAM: Neural Implicit Mapping and Self-Supervised Feature Tracking With Depth Completion and Denoising [23.876281686625134]
我々は,高精度で密度の高い深度推定,ロバストなカメラトラッキング,新しいビューの現実的な合成を実現するフレームワークNeSLAMを提案する。
各種屋内データセットを用いた実験は、再構築、品質追跡、新しいビュー合成におけるシステムの有効性と精度を示す。
論文 参考訳(メタデータ) (2024-03-29T07:59:37Z) - Loopy-SLAM: Dense Neural SLAM with Loop Closures [53.11936461015725]
ポーズをグローバルに最適化するLoopy-SLAMと高密度3Dモデルを導入する。
我々は,データ駆動のポイントベースサブマップ生成手法を用いてフレーム・ツー・モデル追跡を行い,グローバルな位置認識を行うことで,オンラインのループクロージャをトリガーする。
合成Replicaおよび実世界のTUM-RGBDおよびScanNetデータセットの評価は、既存の高密度ニューラルネットワークRGBD SLAM法と比較して、追跡、マッピング、レンダリングの精度の競争力または優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-14T18:18:32Z) - Gaussian Splatting SLAM [16.3858380078553]
単分子SLAMにおける3次元ガウス散乱の最初の応用について述べる。
我々の方法は3fpsで動作し、正確な追跡、マッピング、高品質なレンダリングに必要な表現を統一する。
ライブカメラから高忠実度で連続的に3Dシーンを再構築するためには、いくつかの革新が必要である。
論文 参考訳(メタデータ) (2023-12-11T18:19:04Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - HI-SLAM: Monocular Real-time Dense Mapping with Hybrid Implicit Fields [11.627951040865568]
最近のニューラルマッピングフレームワークは有望な結果を示しているが、RGB-Dやポーズ入力に依存している。
我々のアプローチは、高密度SLAMとニューラル暗黙の場を統合する。
ニューラルネットワークの効率的な構築には,マルチレゾリューショングリッド符号化と符号付き距離関数を用いる。
論文 参考訳(メタデータ) (2023-10-07T12:26:56Z) - NICER-SLAM: Neural Implicit Scene Encoding for RGB SLAM [111.83168930989503]
NICER-SLAMは、カメラポーズと階層的なニューラル暗黙マップ表現を同時に最適化するRGB SLAMシステムである。
近年のRGB-D SLAMシステムと競合する高密度マッピング,追跡,新しいビュー合成において,高い性能を示す。
論文 参考訳(メタデータ) (2023-02-07T17:06:34Z) - ESLAM: Efficient Dense SLAM System Based on Hybrid Representation of
Signed Distance Fields [2.0625936401496237]
ESLAMは、未知のカメラポーズでRGB-Dフレームを読み出し、シーン表現を漸進的に再構築する。
ESLAMは3次元再構成の精度を向上し、最先端の高密度視覚SLAM法のカメラローカライゼーションを50%以上向上する。
論文 参考訳(メタデータ) (2022-11-21T18:25:14Z) - SCFusion: Real-time Incremental Scene Reconstruction with Semantic
Completion [86.77318031029404]
本研究では,シーン再構成とセマンティックシーン補完を段階的かつリアルタイムに共同で行うフレームワークを提案する。
我々のフレームワークは、3Dグローバルモデルでセマンティックコンプリートを正確かつ効率的に融合させるために、占有マップを処理し、ボクセル状態を活用するように設計された新しいニューラルアーキテクチャに依存している。
論文 参考訳(メタデータ) (2020-10-26T15:31:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。