論文の概要: LangGS-SLAM: Real-Time Language-Feature Gaussian Splatting SLAM
- arxiv url: http://arxiv.org/abs/2602.06991v1
- Date: Wed, 28 Jan 2026 05:35:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 12:01:13.500444
- Title: LangGS-SLAM: Real-Time Language-Feature Gaussian Splatting SLAM
- Title(参考訳): LangGS-SLAM: リアルタイム言語機能ガウススティングSLAM
- Authors: Seongbo Ha, Sibaek Lee, Kyungsu Kang, Joonyeol Choi, Seungjun Tak, Hyeonwoo Yu,
- Abstract要約: RGB-D SLAM システムは低遅延追跡とマッピングを継続しながら,言語対応の高密度特徴場を再構築する。
システムは15FPSで動作しながら、幾何学的のみのベースラインとオフラインアプローチに匹敵する意味的忠実性よりも優れた幾何学的忠実性を実現する。
- 参考スコア(独自算出の注目度): 2.738569311610586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a RGB-D SLAM system that reconstructs a language-aligned dense feature field while sustaining low-latency tracking and mapping. First, we introduce a Top-K Rendering pipeline, a high-throughput and semantic-distortion-free method for efficiently rendering high-dimensional feature maps. To address the resulting semantic-geometric discrepancy and mitigate the memory consumption, we further design a multi-criteria map management strategy that prunes redundant or inconsistent Gaussians while preserving scene integrity. Finally, a hybrid field optimization framework jointly refines the geometric and semantic fields under real-time constraints by decoupling their optimization frequencies according to field characteristics. The proposed system achieves superior geometric fidelity compared to geometric-only baselines and comparable semantic fidelity to offline approaches while operating at 15 FPS. Our results demonstrate that online SLAM with dense, uncompressed language-aligned feature fields is both feasible and effective, bridging the gap between 3D perception and language-based reasoning.
- Abstract(参考訳): 本稿では,RGB-D SLAMシステムを提案する。
まず,高次元特徴写像を効率よくレンダリングする高スループットかつ意味歪みのないTop-K Rendering Pipelineを提案する。
結果として生じる意味幾何学的相違に対処し、メモリ消費を軽減するため、シーンの完全性を保ちつつ、冗長性や一貫性のないガウスを具現化するマルチ基準マップ管理戦略を更に設計する。
最後に、ハイブリッドフィールド最適化フレームワークは、フィールド特性に応じて最適化周波数を分離することにより、リアルタイム制約下での幾何学的および意味的フィールドを共同で洗練する。
提案システムは,15FPSで動作しながら,幾何学的のみのベースラインとオフラインアプローチに匹敵する意味的忠実度に対して,優れた幾何学的忠実度を実現する。
以上の結果から、3次元認識と言語に基づく推論のギャップを埋めることで、密集した非圧縮言語対応機能フィールドを持つオンラインSLAMが実現可能かつ効果的であることを示す。
関連論文リスト
- Joint Semantic and Rendering Enhancements in 3D Gaussian Modeling with Anisotropic Local Encoding [86.55824709875598]
本稿では,セマンティックとレンダリングの両方を相乗化する3次元セマンティックガウスモデリングのための統合拡張フレームワークを提案する。
従来の点雲形状符号化とは異なり、細粒度3次元形状を捉えるために異方性3次元ガウシアン・チェビシェフ記述子を導入する。
我々は、学習した形状パターンを継続的に更新するために、クロスシーンの知識伝達モジュールを使用し、より高速な収束と堅牢な表現を可能にします。
論文 参考訳(メタデータ) (2026-01-05T18:33:50Z) - SegSplat: Feed-forward Gaussian Splatting and Open-Set Semantic Segmentation [114.57192386025373]
SegSplatは、高速でフィードフォワードな3D再構成とリッチでオープンなセマンティック理解のギャップを埋めるために設計された、新しいフレームワークである。
この研究は、意味的に認識された3D環境の実践的でオンザフライな生成に向けた重要なステップである。
論文 参考訳(メタデータ) (2025-11-23T10:26:38Z) - LEGO-SLAM: Language-Embedded Gaussian Optimization SLAM [2.0524609401792397]
本稿では、3DGSベースのSLAMシステム内でリアルタイムなオープン語彙マッピングを実現するフレームワークであるLEGO-SLAMを提案する。
提案手法のコアとなるのはシーン適応型エンコーダデコーダで, 高次元言語埋め込みをコンパクトな16次元特徴空間に蒸留する。
LEGO-SLAMは15FPSでオープン語彙機能を提供しながら、競争力のあるマッピング品質とトラッキング精度を実現している。
論文 参考訳(メタデータ) (2025-11-20T08:31:34Z) - Multi-Sample Anti-Aliasing and Constrained Optimization for 3D Gaussian Splatting [6.336372495476242]
本稿では,マルチサンプル・アンチエイリアスと2つの幾何学的制約を組み合わせた総合最適化フレームワークを提案する。
本システムでは,4重サブサンプルの適応ブレンディングにより画素色を計算し,高周波成分のエイリアスを効果的に低減する。
本手法は,特に高周波テクスチャと鋭い不連続の保存において,詳細な保存における最先端性能を実現する。
論文 参考訳(メタデータ) (2025-08-14T10:14:36Z) - Pseudo Depth Meets Gaussian: A Feed-forward RGB SLAM Baseline [64.42938561167402]
本稿では,3次元ガウス型SLAMとフィードフォワードリカレント予測モジュールを組み合わせたオンライン3次元再構成手法を提案する。
このアプローチは、遅いテスト時間の最適化を高速なネットワーク推論に置き換え、トラッキング速度を大幅に改善する。
提案手法は,最先端のSplaTAMと同等の性能を示しながら,追跡時間を90%以上削減する。
論文 参考訳(メタデータ) (2025-08-06T16:16:58Z) - GSFF-SLAM: 3D Semantic Gaussian Splatting SLAM via Feature Field [17.57215792490409]
GSFF-SLAMは3次元ガウススプラッティングに基づく新しい意味論的SLAMシステムである。
提案手法は, 様々な2次元先行情報, 特にスパース信号と雑音信号を用いた意味的再構成を支援する。
2D基底真理を利用する場合、GSFF-SLAMは95.03% mIoUで最先端のセマンティックセグメンテーション性能を達成する。
論文 参考訳(メタデータ) (2025-04-28T01:21:35Z) - Topology-Aware 3D Gaussian Splatting: Leveraging Persistent Homology for Optimized Structural Integrity [3.792470553976718]
本研究はトポロジーを意識した3次元ガウス散乱(トポロジー-GS)を紹介する。
トポロジー-GSは、不完全な初期幾何学的カバレッジのためにピクセルレベルの構造的整合性を損なう。
3つの新しいビューベンチマーク実験により、PSNR、SSIM、LPIPSの指標で、Topology-GSが既存の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-12-21T13:25:03Z) - GOI: Find 3D Gaussians of Interest with an Optimizable Open-vocabulary Semantic-space Hyperplane [53.388937705785025]
3Dオープンボキャブラリのシーン理解は、拡張現実とロボット応用の推進に不可欠である。
GOIは2次元視覚言語基礎モデルから3次元ガウススプラッティング(3DGS)に意味的特徴を統合するフレームワークである。
提案手法では,特徴空間内の超平面分割として特徴選択処理を扱い,クエリに関連性の高い特徴のみを保持する。
論文 参考訳(メタデータ) (2024-05-27T18:57:18Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - HI-SLAM: Monocular Real-time Dense Mapping with Hybrid Implicit Fields [11.627951040865568]
最近のニューラルマッピングフレームワークは有望な結果を示しているが、RGB-Dやポーズ入力に依存している。
我々のアプローチは、高密度SLAMとニューラル暗黙の場を統合する。
ニューラルネットワークの効率的な構築には,マルチレゾリューショングリッド符号化と符号付き距離関数を用いる。
論文 参考訳(メタデータ) (2023-10-07T12:26:56Z) - Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。
グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。
計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-03-23T12:28:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。