論文の概要: SING3R-SLAM: Submap-based Indoor Monocular Gaussian SLAM with 3D Reconstruction Priors
- arxiv url: http://arxiv.org/abs/2511.17207v1
- Date: Fri, 21 Nov 2025 12:40:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.017535
- Title: SING3R-SLAM: Submap-based Indoor Monocular Gaussian SLAM with 3D Reconstruction Priors
- Title(参考訳): SING3R-SLAM:3次元再構成プリミティブを用いたサブマップによる室内モノクラーガウスSLAM
- Authors: Kunyi Li, Michael Niemeyer, Sen Wang, Stefano Gasperini, Nassir Navab, Federico Tombari,
- Abstract要約: SING3R-SLAMはガウスベースの高密度RGB SLAMフレームワークである。
SING3R-SLAMは最先端のトラッキング、3D再構成、新しいビューレンダリングを実現し、12%以上の精度向上を実現し、より細かな幾何を創出する。
- 参考スコア(独自算出の注目度): 80.51557267896938
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in dense 3D reconstruction enable the accurate capture of local geometry; however, integrating them into SLAM is challenging due to drift and redundant point maps, which limit efficiency and downstream tasks, such as novel view synthesis. To address these issues, we propose SING3R-SLAM, a globally consistent and compact Gaussian-based dense RGB SLAM framework. The key idea is to combine locally consistent 3D reconstructions with a unified global Gaussian representation that jointly refines scene geometry and camera poses, enabling efficient and versatile 3D mapping for multiple downstream applications. SING3R-SLAM first builds locally consistent submaps through our lightweight tracking and reconstruction module, and then progressively aligns and fuses them into a global Gaussian map that enforces cross-view geometric consistency. This global map, in turn, provides feedback to correct local drift and enhance the robustness of tracking. Extensive experiments demonstrate that SING3R-SLAM achieves state-of-the-art tracking, 3D reconstruction, and novel view rendering, resulting in over 12% improvement in tracking and producing finer, more detailed geometry, all while maintaining a compact and memory-efficient global representation on real-world datasets.
- Abstract(参考訳): 近年の高密度3次元再構成の進歩により、局所幾何学の正確な取得が可能となっているが、これらをSLAMに統合することは、新しいビュー合成のような効率性や下流のタスクを制限する、ドリフトと冗長な点マップのために困難である。
これらの問題に対処するために,グローバルに一貫したコンパクトなガウスベースのRGB SLAMフレームワークであるSING3R-SLAMを提案する。
キーとなるアイデアは、局所的に一貫した3D再構成と、シーンの幾何学とカメラのポーズを共同で洗練するグローバルガウス表現を組み合わせることで、複数の下流アプリケーションに対して効率的で汎用的な3Dマッピングを可能にすることである。
SING3R-SLAMはまず、私たちの軽量な追跡と再構築モジュールを通して局所的に一貫したサブマップを構築し、その後徐々にそれらをグローバルなガウスマップに整列させて融合させます。
このグローバルマップは,局所的なドリフトを補正し,追跡の堅牢性を高めるためのフィードバックを提供する。
大規模な実験により、SING3R-SLAMは最先端のトラッキング、3D再構成、新しいビューレンダリングを実現し、現実世界のデータセットにコンパクトでメモリ効率のよいグローバル表現を維持しながら、より微細で詳細な形状の追跡と生成を12%以上改善した。
関連論文リスト
- SLAM3R: Real-Time Dense Scene Reconstruction from Monocular RGB Videos [33.57444419305241]
SLAM3Rは、RGBビデオを用いたリアルタイム、高品質、高密度な3D再構成のための新しいシステムである。
フィードフォワードニューラルネットワークを通じて、ローカルな3D再構成とグローバルな座標登録をシームレスに統合する。
20FPS以上のリアルタイム性能を維持しつつ、最先端の復元精度と完全性を達成する。
論文 参考訳(メタデータ) (2024-12-12T16:08:03Z) - IG-SLAM: Instant Gaussian SLAM [6.228980850646457]
3D Gaussian SplattingはSLAMシステムにおける代替シーン表現として期待できる結果を示した。
本稿では,RGBのみの高密度SLAMシステムであるIG-SLAMについて述べる。
我々は、最先端のRGBのみのSLAMシステムと競合する性能を示し、高速な動作速度を実現する。
論文 参考訳(メタデータ) (2024-08-02T09:07:31Z) - Splat-SLAM: Globally Optimized RGB-only SLAM with 3D Gaussians [87.48403838439391]
3D Splattingは、RGBのみの高密度SLAMの幾何学と外観の強力な表現として登場した。
本稿では,高密度な3次元ガウス写像表現を持つRGBのみのSLAMシステムを提案する。
Replica、TUM-RGBD、ScanNetのデータセットに対する実験は、グローバルに最適化された3Dガウスの有効性を示している。
論文 参考訳(メタデータ) (2024-05-26T12:26:54Z) - Loopy-SLAM: Dense Neural SLAM with Loop Closures [53.11936461015725]
ポーズをグローバルに最適化するLoopy-SLAMと高密度3Dモデルを導入する。
我々は,データ駆動のポイントベースサブマップ生成手法を用いてフレーム・ツー・モデル追跡を行い,グローバルな位置認識を行うことで,オンラインのループクロージャをトリガーする。
合成Replicaおよび実世界のTUM-RGBDおよびScanNetデータセットの評価は、既存の高密度ニューラルネットワークRGBD SLAM法と比較して、追跡、マッピング、レンダリングの精度の競争力または優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-14T18:18:32Z) - GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction [45.49960166785063]
GO-SLAMは、リアルタイムでポーズと3D再構成をグローバルに最適化するディープラーニングベースの高密度ビジュアルSLAMフレームワークである。
さまざまな合成および実世界のデータセットの結果から、GO-SLAMはロバスト性や復元精度の追跡において最先端のアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2023-09-05T17:59:58Z) - NICER-SLAM: Neural Implicit Scene Encoding for RGB SLAM [111.83168930989503]
NICER-SLAMは、カメラポーズと階層的なニューラル暗黙マップ表現を同時に最適化するRGB SLAMシステムである。
近年のRGB-D SLAMシステムと競合する高密度マッピング,追跡,新しいビュー合成において,高い性能を示す。
論文 参考訳(メタデータ) (2023-02-07T17:06:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。