論文の概要: GigaSLAM: Large-Scale Monocular SLAM with Hierachical Gaussian Splats
- arxiv url: http://arxiv.org/abs/2503.08071v1
- Date: Tue, 11 Mar 2025 06:05:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 19:17:43.144948
- Title: GigaSLAM: Large-Scale Monocular SLAM with Hierachical Gaussian Splats
- Title(参考訳): GigaSLAM: 階層型ガウスプレートを用いた大規模単分子SLAM
- Authors: Kai Deng, Jian Yang, Shenlong Wang, Jin Xie,
- Abstract要約: 大規模で非有界な屋外環境のための最初のNeRF/3DGSベースのSLAMフレームワークであるGigaSLAMを紹介する。
我々のアプローチは階層的なスパースボクセルマップ表現を採用しており、ガウシアンはニューラルネットワークによって複数の詳細レベルで復号化されている。
GigaSLAMは、都市の屋外ベンチマークで高精度なトラッキングと視覚的に忠実なレンダリングを提供する。
- 参考スコア(独自算出の注目度): 30.608403266769788
- License:
- Abstract: Tracking and mapping in large-scale, unbounded outdoor environments using only monocular RGB input presents substantial challenges for existing SLAM systems. Traditional Neural Radiance Fields (NeRF) and 3D Gaussian Splatting (3DGS) SLAM methods are typically limited to small, bounded indoor settings. To overcome these challenges, we introduce GigaSLAM, the first NeRF/3DGS-based SLAM framework for kilometer-scale outdoor environments, as demonstrated on the KITTI and KITTI 360 datasets. Our approach employs a hierarchical sparse voxel map representation, where Gaussians are decoded by neural networks at multiple levels of detail. This design enables efficient, scalable mapping and high-fidelity viewpoint rendering across expansive, unbounded scenes. For front-end tracking, GigaSLAM utilizes a metric depth model combined with epipolar geometry and PnP algorithms to accurately estimate poses, while incorporating a Bag-of-Words-based loop closure mechanism to maintain robust alignment over long trajectories. Consequently, GigaSLAM delivers high-precision tracking and visually faithful rendering on urban outdoor benchmarks, establishing a robust SLAM solution for large-scale, long-term scenarios, and significantly extending the applicability of Gaussian Splatting SLAM systems to unbounded outdoor environments.
- Abstract(参考訳): 単分子RGB入力のみを用いた大規模で非有界な屋外環境における追跡とマッピングは、既存のSLAMシステムにとって大きな課題となる。
従来のニューラル・レージアン・フィールド(NeRF)と3Dガウス・スプレイティング(3DGS)のSLAM法は、通常は小型で有界な屋内設定に限られる。
これらの課題を克服するために、KITTIとKITTI 360データセットで示されているように、最初のNeRF/3DGSベースの屋外環境のためのSLAMフレームワークであるGigaSLAMを紹介した。
我々のアプローチは階層的なスパースボクセルマップ表現を採用しており、ガウシアンはニューラルネットワークによって複数の詳細レベルで復号化されている。
この設計により、広範で非有界なシーンにまたがる、効率的でスケーラブルなマッピングと高忠実な視点レンダリングが可能になる。
フロントエンド追跡において、GigaSLAMは、エピポーラ幾何学とPnPアルゴリズムを組み合わせた計量深度モデルを用いて、ポーズを正確に推定し、長い軌道上のロバストなアライメントを維持するために、Bag-of-Wordsベースのループクロージャ機構を組み込んだ。
その結果、GigaSLAMは、都市屋外のベンチマークで高精度な追跡と視覚的に忠実なレンダリングを提供し、大規模で長期的なシナリオに対する堅牢なSLAMソリューションを確立し、ガウススティングSLAMシステムの非有界屋外環境への適用性を著しく拡張した。
関連論文リスト
- VIGS SLAM: IMU-based Large-Scale 3D Gaussian Splatting SLAM [15.841609263723576]
大規模屋内環境のための新しい3次元ガウス散乱SLAM法VIGS SLAMを提案する。
提案手法は, ガウススプラッティングに基づくSLAMを, IMUセンサを組み込むことで, 大規模環境で効果的に実現できることを示す最初の方法である。
この提案は,室内シナリオを超えてガウススティングSLAMの性能を向上させるだけでなく,大規模屋内環境における最先端手法に匹敵するSLAM性能を実現する。
論文 参考訳(メタデータ) (2025-01-23T06:01:03Z) - VINGS-Mono: Visual-Inertial Gaussian Splatting Monocular SLAM in Large Scenes [10.287279799581544]
VINGS-Monoは、大きなシーン用に設計された単分子(慣性)ガウススプラッティング(GS)SLAMフレームワークである。
このフレームワークは、VIO Front End、2D Gaussian Map、NVS Loop Closure、Dynamic Eraserの4つの主要コンポーネントで構成されている。
論文 参考訳(メタデータ) (2025-01-14T18:01:15Z) - MotionGS : Compact Gaussian Splatting SLAM by Motion Filter [10.979138131565238]
NeRFベースのSLAMは急増しているが、3DGSベースのSLAMは希薄である。
本稿では, 深部視覚特徴, 二重選択, 3DGSを融合した新しい3DGSベースのSLAM手法を提案する。
論文 参考訳(メタデータ) (2024-05-18T00:47:29Z) - MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。
我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。
また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文 参考訳(メタデータ) (2024-04-01T04:57:41Z) - GlORIE-SLAM: Globally Optimized RGB-only Implicit Encoding Point Cloud SLAM [53.6402869027093]
フレキシブルなニューラルポイントクラウド表現シーンを用いたRGBのみの高密度SLAMシステムを提案する。
また,単分子深度とともに暗黙のポーズと深さを最適化する新しいDSPO層を導入する。
論文 参考訳(メタデータ) (2024-03-28T16:32:06Z) - CG-SLAM: Efficient Dense RGB-D SLAM in a Consistent Uncertainty-aware 3D Gaussian Field [46.8198987091734]
本稿では,新しい不確実性を考慮した3次元ガウス場に基づく高密度RGB-D SLAMシステム,すなわちCG-SLAMを提案する。
各種データセットの実験により、CG-SLAMは、最大15Hzの追従速度で優れた追従性能とマッピング性能を達成することが示された。
論文 参考訳(メタデータ) (2024-03-24T11:19:59Z) - MoD-SLAM: Monocular Dense Mapping for Unbounded 3D Scene Reconstruction [2.3630527334737104]
MoD-SLAMは、非有界シーンにおけるリアルタイムな3次元再構成を可能にする、最初のモノクラーNeRFを用いた高密度マッピング法である。
追跡処理にロバストな深度損失項を導入することにより,大規模シーンにおけるより正確なポーズ推定を実現する。
2つの標準データセットを用いた実験により, MoD-SLAMは競争性能を向上し, 3次元再構成の精度を最大30%, 15%向上した。
論文 参考訳(メタデータ) (2024-02-06T07:07:33Z) - SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM [48.190398577764284]
SplaTAMは、単一のRGB-Dカメラからの高忠実度再構成を可能にするアプローチである。
基礎となるガウス表現に合わせて、単純なオンライントラッキングとマッピングシステムを採用している。
実験により,SplaTAMはカメラポーズ推定,マップ構築,既存手法に対する新規ビュー合成において最大2倍の性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-12-04T18:53:24Z) - NICER-SLAM: Neural Implicit Scene Encoding for RGB SLAM [111.83168930989503]
NICER-SLAMは、カメラポーズと階層的なニューラル暗黙マップ表現を同時に最適化するRGB SLAMシステムである。
近年のRGB-D SLAMシステムと競合する高密度マッピング,追跡,新しいビュー合成において,高い性能を示す。
論文 参考訳(メタデータ) (2023-02-07T17:06:34Z) - NICE-SLAM: Neural Implicit Scalable Encoding for SLAM [112.6093688226293]
NICE-SLAMは階層的なシーン表現を導入することでマルチレベルローカル情報を組み込んだ高密度SLAMシステムである。
最近の暗黙的SLAMシステムと比較して、私たちのアプローチはよりスケーラブルで効率的で堅牢です。
論文 参考訳(メタデータ) (2021-12-22T18:45:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。