論文の概要: LEG-SLAM: Real-Time Language-Enhanced Gaussian Splatting for SLAM
- arxiv url: http://arxiv.org/abs/2506.03073v1
- Date: Tue, 03 Jun 2025 16:51:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.873422
- Title: LEG-SLAM: Real-Time Language-Enhanced Gaussian Splatting for SLAM
- Title(参考訳): LEG-SLAM: SLAMのためのリアルタイム言語拡張ガウススプレイティング
- Authors: Roman Titkov, Egor Zubkov, Dmitry Yudin, Jaafar Mahmoud, Malik Mohrat, Gennady Sidorov,
- Abstract要約: LEG-SLAMは、最適化されたガウススプラッティング実装と視覚言語の特徴抽出を融合した新しいアプローチである。
提案手法は,高品質なフォトリアリスティック画像とセマンティックラベル付きシーンマップを同時に生成する。
自律型ロボティクス、拡張現実、その他の対話型ドメインへの潜在的な応用により、LEG-SLAMはリアルタイムなセマンティック3DガウスベースのSLAMにおける重要な一歩である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern Gaussian Splatting methods have proven highly effective for real-time photorealistic rendering of 3D scenes. However, integrating semantic information into this representation remains a significant challenge, especially in maintaining real-time performance for SLAM (Simultaneous Localization and Mapping) applications. In this work, we introduce LEG-SLAM -- a novel approach that fuses an optimized Gaussian Splatting implementation with visual-language feature extraction using DINOv2 followed by a learnable feature compressor based on Principal Component Analysis, while enabling an online dense SLAM. Our method simultaneously generates high-quality photorealistic images and semantically labeled scene maps, achieving real-time scene reconstruction with more than 10 fps on the Replica dataset and 18 fps on ScanNet. Experimental results show that our approach significantly outperforms state-of-the-art methods in reconstruction speed while achieving competitive rendering quality. The proposed system eliminates the need for prior data preparation such as camera's ego motion or pre-computed static semantic maps. With its potential applications in autonomous robotics, augmented reality, and other interactive domains, LEG-SLAM represents a significant step forward in real-time semantic 3D Gaussian-based SLAM. Project page: https://titrom025.github.io/LEG-SLAM/
- Abstract(参考訳): 現代のガウス散乱法は3次元シーンのリアルタイム光実写レンダリングに極めて有効であることが証明されている。
しかし、この表現に意味情報を統合することは、特にSLAM(Simultaneous Localization and Mapping)アプリケーションのリアルタイムパフォーマンスを維持する上で、大きな課題である。
本研究では,DINOv2を用いた視覚言語特徴抽出に最適化されたガウス・スプラッティングの実装を融合させる新しい手法であるLEG-SLAMと,主成分分析に基づく学習可能な特徴圧縮器とを併用し,オンライン高密度SLAMを実現する手法を提案する。
提案手法は高品質なフォトリアリスティック画像とセマンティックラベル付きシーンマップを同時に生成し,Replicaデータセット上で10fps以上,ScanNet上で18fps以上のリアルタイムシーン再構成を実現する。
実験結果から,提案手法は高い精度で再現速度を向上し,かつ,競争力のあるレンダリング品質を実現していることがわかった。
提案システムでは,カメラのエゴ運動や事前計算された静的セマンティックマップなどの事前データ準備の必要性を排除している。
自律型ロボティクス、拡張現実、その他の対話型ドメインへの潜在的な応用により、LEG-SLAMはリアルタイムなセマンティック3DガウスベースのSLAMにおける重要な一歩である。
プロジェクトページ: https://titrom025.github.io/LEG-SLAM/
関連論文リスト
- EVolSplat: Efficient Volume-based Gaussian Splatting for Urban View Synthesis [61.1662426227688]
既存のNeRFおよび3DGSベースの手法は、フォトリアリスティックレンダリングを実現する上で有望な結果を示すが、スローでシーンごとの最適化が必要である。
本稿では,都市景観を対象とした効率的な3次元ガウススプレイティングモデルEVolSplatを紹介する。
論文 参考訳(メタデータ) (2025-03-26T02:47:27Z) - Gaussian-SLAM: Photo-realistic Dense SLAM with Gaussian Splatting [24.160436463991495]
本稿では3次元ガウスアンをシーン表現として用いたSLAM法を提案する。
本手法は,実世界のシングルカメラRGBDビデオから,インタラクティブなリアルタイム再構成と写真リアルレンダリングを実現する。
論文 参考訳(メタデータ) (2023-12-06T10:47:53Z) - SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM [48.190398577764284]
SplaTAMは、単一のRGB-Dカメラからの高忠実度再構成を可能にするアプローチである。
基礎となるガウス表現に合わせて、単純なオンライントラッキングとマッピングシステムを採用している。
実験により,SplaTAMはカメラポーズ推定,マップ構築,既存手法に対する新規ビュー合成において最大2倍の性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-12-04T18:53:24Z) - DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - Photo-SLAM: Real-time Simultaneous Localization and Photorealistic Mapping for Monocular, Stereo, and RGB-D Cameras [27.543561055868697]
Photo-SLAMは、ハイパープリミティブマップを備えた新しいSLAMフレームワークである。
そこで我々は,局所化のための明示的な幾何学的特徴を利用して,観測環境のテクスチャ情報を表現するために暗黙的な測光的特徴を学習する。
提案システムは,オンラインフォトリアリスティックマッピングのための最先端SLAMシステムよりも優れている。
論文 参考訳(メタデータ) (2023-11-28T12:19:00Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。