論文の概要: SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM
- arxiv url: http://arxiv.org/abs/2312.02126v1
- Date: Mon, 4 Dec 2023 18:53:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 14:05:58.275140
- Title: SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM
- Title(参考訳): SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM
- Authors: Nikhil Keetha, Jay Karhade, Krishna Murthy Jatavallabhula, Gengshan
Yang, Sebastian Scherer, Deva Ramanan, Jonathon Luiten
- Abstract要約: 3Dガウシアンによるシーンの表現は、単一の単眼のRGB-Dカメラを用いて高密度SLAMを実現することができることを示す。
私たちはオンラインのトラッキングとマッピングのパイプラインを採用し、基礎となるガウス表現を特に使用するように調整しています。
実験により、SplaTAMは、カメラポーズ推定、マップ構築、ノベルビュー合成において、最先端の性能を最大2倍に向上することが示された。
- 参考スコア(独自算出の注目度): 50.60694084264132
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Dense simultaneous localization and mapping (SLAM) is pivotal for embodied
scene understanding. Recent work has shown that 3D Gaussians enable
high-quality reconstruction and real-time rendering of scenes using multiple
posed cameras. In this light, we show for the first time that representing a
scene by 3D Gaussians can enable dense SLAM using a single unposed monocular
RGB-D camera. Our method, SplaTAM, addresses the limitations of prior radiance
field-based representations, including fast rendering and optimization, the
ability to determine if areas have been previously mapped, and structured map
expansion by adding more Gaussians. We employ an online tracking and mapping
pipeline while tailoring it to specifically use an underlying Gaussian
representation and silhouette-guided optimization via differentiable rendering.
Extensive experiments show that SplaTAM achieves up to 2X state-of-the-art
performance in camera pose estimation, map construction, and novel-view
synthesis, demonstrating its superiority over existing approaches, while
allowing real-time rendering of a high-resolution dense 3D map.
- Abstract(参考訳): 濃密な同時局所化とマッピング(SLAM)は、シーン理解の具体化に重要である。
近年の研究では、3Dガウシアンが複数のカメラを用いて高画質の再現とリアルタイムレンダリングを可能にすることが示されている。
この光で、3Dガウシアンによるシーンの表現は、単一の単眼のRGB-Dカメラを用いて高密度SLAMを実現することができることを示す。
提案手法であるsplatamは,高速レンダリングや最適化,領域が以前にマッピングされたかどうかの判断,ガウス関数の追加による構造化マップ拡張などを含む,事前の輝度場に基づく表現の制限に対処する。
オンライントラッキングとマッピングのパイプラインを使用し、基礎となるガウス表現と、微分レンダリングによるシルエット誘導最適化を特に使用するように調整しています。
広汎な実験により、SplaTAMは、カメラポーズ推定、マップ構築、ノベルビュー合成において最大2倍の性能を達成し、既存のアプローチよりも優位性を示しながら、高解像度の高密度3Dマップのリアルタイムレンダリングを可能にした。
関連論文リスト
- IG-SLAM: Instant Gaussian SLAM [6.228980850646457]
3D Gaussian SplattingはSLAMシステムにおける代替シーン表現として期待できる結果を示した。
本稿では,RGBのみの高密度SLAMシステムであるIG-SLAMについて述べる。
我々は、最先端のRGBのみのSLAMシステムと競合する性能を示し、高速な動作速度を実現する。
論文 参考訳(メタデータ) (2024-08-02T09:07:31Z) - Splat-SLAM: Globally Optimized RGB-only SLAM with 3D Gaussians [87.48403838439391]
3D Splattingは、RGBのみの高密度SLAMの幾何学と外観の強力な表現として登場した。
本稿では,高密度な3次元ガウス写像表現を持つRGBのみのSLAMシステムを提案する。
Replica、TUM-RGBD、ScanNetのデータセットに対する実験は、グローバルに最適化された3Dガウスの有効性を示している。
論文 参考訳(メタデータ) (2024-05-26T12:26:54Z) - MVSGaussian: Fast Generalizable Gaussian Splatting Reconstruction from Multi-View Stereo [54.00987996368157]
MVSGaussianは、Multi-View Stereo(MVS)から導かれる新しい一般化可能な3次元ガウス表現手法である。
MVSGaussianは、シーンごとにより良い合成品質でリアルタイムレンダリングを実現する。
論文 参考訳(メタデータ) (2024-05-20T17:59:30Z) - MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。
我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。
また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文 参考訳(メタデータ) (2024-04-01T04:57:41Z) - RGBD GS-ICP SLAM [1.3108652488669732]
一般化反復閉点(G-ICP)と3次元ガウススプラッティング(DGS)を融合した新しい密度表現SLAM手法を提案する。
実験の結果,提案手法の有効性が示され,非常に高速な107 FPSが得られた。
論文 参考訳(メタデータ) (2024-03-19T08:49:48Z) - Gaussian Splatting SLAM [16.3858380078553]
単分子SLAMにおける3次元ガウス散乱の最初の応用について述べる。
我々の方法は3fpsで動作し、正確な追跡、マッピング、高品質なレンダリングに必要な表現を統一する。
ライブカメラから高忠実度で連続的に3Dシーンを再構築するためには、いくつかの革新が必要である。
論文 参考訳(メタデータ) (2023-12-11T18:19:04Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - NICER-SLAM: Neural Implicit Scene Encoding for RGB SLAM [111.83168930989503]
NICER-SLAMは、カメラポーズと階層的なニューラル暗黙マップ表現を同時に最適化するRGB SLAMシステムである。
近年のRGB-D SLAMシステムと競合する高密度マッピング,追跡,新しいビュー合成において,高い性能を示す。
論文 参考訳(メタデータ) (2023-02-07T17:06:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。