論文の概要: LangGS-SLAM: Real-Time Language-Feature Gaussian Splatting SLAM
- arxiv url: http://arxiv.org/abs/2602.06991v1
- Date: Wed, 28 Jan 2026 05:35:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 12:01:13.500444
- Title: LangGS-SLAM: Real-Time Language-Feature Gaussian Splatting SLAM
- Title(参考訳): LangGS-SLAM: リアルタイム言語機能ガウススティングSLAM
- Authors: Seongbo Ha, Sibaek Lee, Kyungsu Kang, Joonyeol Choi, Seungjun Tak, Hyeonwoo Yu,
- Abstract要約: RGB-D SLAM システムは低遅延追跡とマッピングを継続しながら,言語対応の高密度特徴場を再構築する。
システムは15FPSで動作しながら、幾何学的のみのベースラインとオフラインアプローチに匹敵する意味的忠実性よりも優れた幾何学的忠実性を実現する。
- 参考スコア(独自算出の注目度): 2.738569311610586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a RGB-D SLAM system that reconstructs a language-aligned dense feature field while sustaining low-latency tracking and mapping. First, we introduce a Top-K Rendering pipeline, a high-throughput and semantic-distortion-free method for efficiently rendering high-dimensional feature maps. To address the resulting semantic-geometric discrepancy and mitigate the memory consumption, we further design a multi-criteria map management strategy that prunes redundant or inconsistent Gaussians while preserving scene integrity. Finally, a hybrid field optimization framework jointly refines the geometric and semantic fields under real-time constraints by decoupling their optimization frequencies according to field characteristics. The proposed system achieves superior geometric fidelity compared to geometric-only baselines and comparable semantic fidelity to offline approaches while operating at 15 FPS. Our results demonstrate that online SLAM with dense, uncompressed language-aligned feature fields is both feasible and effective, bridging the gap between 3D perception and language-based reasoning.
- Abstract(参考訳): 本稿では,RGB-D SLAMシステムを提案する。
まず,高次元特徴写像を効率よくレンダリングする高スループットかつ意味歪みのないTop-K Rendering Pipelineを提案する。
結果として生じる意味幾何学的相違に対処し、メモリ消費を軽減するため、シーンの完全性を保ちつつ、冗長性や一貫性のないガウスを具現化するマルチ基準マップ管理戦略を更に設計する。
最後に、ハイブリッドフィールド最適化フレームワークは、フィールド特性に応じて最適化周波数を分離することにより、リアルタイム制約下での幾何学的および意味的フィールドを共同で洗練する。
提案システムは,15FPSで動作しながら,幾何学的のみのベースラインとオフラインアプローチに匹敵する意味的忠実度に対して,優れた幾何学的忠実度を実現する。
以上の結果から、3次元認識と言語に基づく推論のギャップを埋めることで、密集した非圧縮言語対応機能フィールドを持つオンラインSLAMが実現可能かつ効果的であることを示す。
関連論文リスト
- LEGO-SLAM: Language-Embedded Gaussian Optimization SLAM [2.0524609401792397]
本稿では、3DGSベースのSLAMシステム内でリアルタイムなオープン語彙マッピングを実現するフレームワークであるLEGO-SLAMを提案する。
提案手法のコアとなるのはシーン適応型エンコーダデコーダで, 高次元言語埋め込みをコンパクトな16次元特徴空間に蒸留する。
LEGO-SLAMは15FPSでオープン語彙機能を提供しながら、競争力のあるマッピング品質とトラッキング精度を実現している。
論文 参考訳(メタデータ) (2025-11-20T08:31:34Z) - GSFF-SLAM: 3D Semantic Gaussian Splatting SLAM via Feature Field [17.57215792490409]
GSFF-SLAMは3次元ガウススプラッティングに基づく新しい意味論的SLAMシステムである。
提案手法は, 様々な2次元先行情報, 特にスパース信号と雑音信号を用いた意味的再構成を支援する。
2D基底真理を利用する場合、GSFF-SLAMは95.03% mIoUで最先端のセマンティックセグメンテーション性能を達成する。
論文 参考訳(メタデータ) (2025-04-28T01:21:35Z) - Topology-Aware 3D Gaussian Splatting: Leveraging Persistent Homology for Optimized Structural Integrity [3.792470553976718]
本研究はトポロジーを意識した3次元ガウス散乱(トポロジー-GS)を紹介する。
トポロジー-GSは、不完全な初期幾何学的カバレッジのためにピクセルレベルの構造的整合性を損なう。
3つの新しいビューベンチマーク実験により、PSNR、SSIM、LPIPSの指標で、Topology-GSが既存の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-12-21T13:25:03Z) - GOI: Find 3D Gaussians of Interest with an Optimizable Open-vocabulary Semantic-space Hyperplane [53.388937705785025]
3Dオープンボキャブラリのシーン理解は、拡張現実とロボット応用の推進に不可欠である。
GOIは2次元視覚言語基礎モデルから3次元ガウススプラッティング(3DGS)に意味的特徴を統合するフレームワークである。
提案手法では,特徴空間内の超平面分割として特徴選択処理を扱い,クエリに関連性の高い特徴のみを保持する。
論文 参考訳(メタデータ) (2024-05-27T18:57:18Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。