論文の概要: VINGS-Mono: Visual-Inertial Gaussian Splatting Monocular SLAM in Large Scenes
- arxiv url: http://arxiv.org/abs/2501.08286v1
- Date: Tue, 14 Jan 2025 18:01:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-15 13:28:27.495943
- Title: VINGS-Mono: Visual-Inertial Gaussian Splatting Monocular SLAM in Large Scenes
- Title(参考訳): VINGS-Mono:大規模シーンにおける視覚-慣性ガウス平滑化モノクロSLAM
- Authors: Ke Wu, Zicheng Zhang, Muer Tie, Ziqing Ai, Zhongxue Gan, Wenchao Ding,
- Abstract要約: VINGS-Monoは、大きなシーン用に設計された単分子(慣性)ガウススプラッティング(GS)SLAMフレームワークである。
このフレームワークは、VIO Front End、2D Gaussian Map、NVS Loop Closure、Dynamic Eraserの4つの主要コンポーネントで構成されている。
- 参考スコア(独自算出の注目度): 10.287279799581544
- License:
- Abstract: VINGS-Mono is a monocular (inertial) Gaussian Splatting (GS) SLAM framework designed for large scenes. The framework comprises four main components: VIO Front End, 2D Gaussian Map, NVS Loop Closure, and Dynamic Eraser. In the VIO Front End, RGB frames are processed through dense bundle adjustment and uncertainty estimation to extract scene geometry and poses. Based on this output, the mapping module incrementally constructs and maintains a 2D Gaussian map. Key components of the 2D Gaussian Map include a Sample-based Rasterizer, Score Manager, and Pose Refinement, which collectively improve mapping speed and localization accuracy. This enables the SLAM system to handle large-scale urban environments with up to 50 million Gaussian ellipsoids. To ensure global consistency in large-scale scenes, we design a Loop Closure module, which innovatively leverages the Novel View Synthesis (NVS) capabilities of Gaussian Splatting for loop closure detection and correction of the Gaussian map. Additionally, we propose a Dynamic Eraser to address the inevitable presence of dynamic objects in real-world outdoor scenes. Extensive evaluations in indoor and outdoor environments demonstrate that our approach achieves localization performance on par with Visual-Inertial Odometry while surpassing recent GS/NeRF SLAM methods. It also significantly outperforms all existing methods in terms of mapping and rendering quality. Furthermore, we developed a mobile app and verified that our framework can generate high-quality Gaussian maps in real time using only a smartphone camera and a low-frequency IMU sensor. To the best of our knowledge, VINGS-Mono is the first monocular Gaussian SLAM method capable of operating in outdoor environments and supporting kilometer-scale large scenes.
- Abstract(参考訳): VINGS-Monoは、大きなシーン用に設計された単分子(慣性)ガウススプラッティング(GS)SLAMフレームワークである。
このフレームワークは、VIO Front End、2D Gaussian Map、NVS Loop Closure、Dynamic Eraserの4つの主要コンポーネントで構成されている。
VIOフロントエンドでは、RGBフレームを高密度バンドル調整と不確実性推定により処理し、シーン形状とポーズを抽出する。
この出力に基づいて、写像モジュールは2次元ガウス写像を漸進的に構成し、維持する。
2Dガウスマップのキーコンポーネントには、サンプルベースのラスタライザ、スコアマネージャ、ポスリファインメントがあり、マッピング速度とローカライズ精度を総合的に改善している。
これによりSLAMシステムは、最大5000万ガウス楕円体を持つ大規模都市環境を処理できる。
大規模シーンにおけるグローバルな整合性を確保するため,ガウス写像のループ閉包検出と修正のためにガウス写像のノベルビュー合成(NVS)機能を革新的に活用するループ閉包モジュールを設計した。
さらに,現実の屋外シーンにおける動的物体の存在を回避できる動的消去器を提案する。
近年のGS/NeRF SLAM法を超越しながら,視覚慣性オドメトリーと同等の局所化性能が得られた。
また、マッピングやレンダリング品質という点で、既存のすべてのメソッドよりも大幅に優れています。
さらに,スマートフォンカメラと低周波IMUセンサのみを用いて,高品質なガウス地図をリアルタイムに作成できることを確認した。
我々の知る限りでは、VINGS-Monoは屋外環境で動作し、キロメートル規模の大規模シーンをサポートすることができる初めての単分子ガウスSLAM法である。
関連論文リスト
- VIGS SLAM: IMU-based Large-Scale 3D Gaussian Splatting SLAM [15.841609263723576]
大規模屋内環境のための新しい3次元ガウス散乱SLAM法VIGS SLAMを提案する。
提案手法は, ガウススプラッティングに基づくSLAMを, IMUセンサを組み込むことで, 大規模環境で効果的に実現できることを示す最初の方法である。
この提案は,室内シナリオを超えてガウススティングSLAMの性能を向上させるだけでなく,大規模屋内環境における最先端手法に匹敵するSLAM性能を実現する。
論文 参考訳(メタデータ) (2025-01-23T06:01:03Z) - GS-LIVO: Real-Time LiDAR, Inertial, and Visual Multi-sensor Fused Odometry with Gaussian Mapping [22.432252084121274]
LiDAR-Inertial-Visual (LIV) センサの構成は、ローカライゼーションと高密度マッピングにおいて優れた性能を示している。
本稿では,新しいリアルタイムガウス型同時ローカライズ・マッピングシステムを提案する。
このフレームワークは、堅牢なマルチセンサー融合機能を維持しながら、リアルタイムのパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-01-15T09:04:56Z) - Dynamic Gaussian Marbles for Novel View Synthesis of Casual Monocular Videos [58.22272760132996]
既存の4次元ガウス法は単分子配置が制約されていないため、この設定で劇的に失敗することを示す。
単分子配置の難易度を目標とした3つのコア修正からなる動的ガウス大理石を提案する。
Nvidia Dynamic ScenesデータセットとDyCheck iPhoneデータセットを評価し,Gaussian Marblesが他のGaussianベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2024-06-26T19:37:07Z) - MVSGaussian: Fast Generalizable Gaussian Splatting Reconstruction from Multi-View Stereo [54.00987996368157]
MVSGaussianは、Multi-View Stereo(MVS)から導かれる新しい一般化可能な3次元ガウス表現手法である。
MVSGaussianは、シーンごとにより良い合成品質でリアルタイムレンダリングを実現する。
論文 参考訳(メタデータ) (2024-05-20T17:59:30Z) - MotionGS : Compact Gaussian Splatting SLAM by Motion Filter [10.979138131565238]
NeRFベースのSLAMは急増しているが、3DGSベースのSLAMは希薄である。
本稿では, 深部視覚特徴, 二重選択, 3DGSを融合した新しい3DGSベースのSLAM手法を提案する。
論文 参考訳(メタデータ) (2024-05-18T00:47:29Z) - MGS-SLAM: Monocular Sparse Tracking and Gaussian Mapping with Depth Smooth Regularization [29.713650915551632]
本稿では,ガウススプラッティングに基づく濃密な視覚的局所化とマッピングのための新しいフレームワークを紹介する。
疎視度追跡と3次元ガウススプラッティングのシーン表現を初めて共同で最適化する。
ポーズ推定の精度は既存の手法や最先端の手法を超越している。
論文 参考訳(メタデータ) (2024-05-10T04:42:21Z) - MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。
我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。
また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文 参考訳(メタデータ) (2024-04-01T04:57:41Z) - Gaussian Splatting SLAM [16.3858380078553]
単分子SLAMにおける3次元ガウス散乱の最初の応用について述べる。
我々の方法は3fpsで動作し、正確な追跡、マッピング、高品質なレンダリングに必要な表現を統一する。
ライブカメラから高忠実度で連続的に3Dシーンを再構築するためには、いくつかの革新が必要である。
論文 参考訳(メタデータ) (2023-12-11T18:19:04Z) - SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM [48.190398577764284]
SplaTAMは、単一のRGB-Dカメラからの高忠実度再構成を可能にするアプローチである。
基礎となるガウス表現に合わせて、単純なオンライントラッキングとマッピングシステムを採用している。
実験により,SplaTAMはカメラポーズ推定,マップ構築,既存手法に対する新規ビュー合成において最大2倍の性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-12-04T18:53:24Z) - FSGS: Real-Time Few-shot View Synthesis using Gaussian Splatting [58.41056963451056]
本稿では,3次元ガウススプラッティングに基づく数ショットビュー合成フレームワークを提案する。
このフレームワークは3つのトレーニングビューでリアルタイムおよびフォトリアリスティックなビュー合成を可能にする。
FSGSは、さまざまなデータセットの精度とレンダリング効率の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-12-01T09:30:02Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。