論文の概要: GGD-SLAM: Monocular 3DGS SLAM Powered by Generalizable Motion Model for Dynamic Environments
- arxiv url: http://arxiv.org/abs/2604.12837v1
- Date: Tue, 14 Apr 2026 14:58:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.519258
- Title: GGD-SLAM: Monocular 3DGS SLAM Powered by Generalizable Motion Model for Dynamic Environments
- Title(参考訳): GGD-SLAM:動的環境に対する一般化可能な運動モデルによる単眼3DGS SLAM
- Authors: Yi Liu, Haoxuan Xu, Hongbo Duan, Keyu Fan, Zhengyang Zhang, Peiyu Zhuang, Pengting Luo, Houde Liu,
- Abstract要約: GGD-SLAMは、動的環境における局所化と高密度マッピングの課題に対処するために、一般化可能な運動モデルを利用するフレームワークである。
静的コンポーネントと動的コンポーネントを分離するために、動的機能拡張器と統合されている。
実世界の動的データセットを用いた実験により,カメラポーズ推定と動的シーンの高密度再構成において,提案方式が最先端の性能を達成することを示した。
- 参考スコア(独自算出の注目度): 7.864663125771112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual SLAM algorithms achieve significant improvements through the exploration of 3D Gaussian Splatting (3DGS) representations, particularly in generating high-fidelity dense maps. However, they depend on a static environment assumption and experience significant performance degradation in dynamic environments. This paper presents GGD-SLAM, a framework that employs a generalizable motion model to address the challenges of localization and dense mapping in dynamic environments - without predefined semantic annotations or depth input. Specifically, the proposed system employs a First-In-First-Out (FIFO) queue to manage incoming frames, facilitating dynamic semantic feature extraction through a sequential attention mechanism. This is integrated with a dynamic feature enhancer to separate static and dynamic components. Additionally, to minimize dynamic distractors' impact on the static components, we devise a method to fill occluded areas via static information sampling and design a distractor-adaptive Structure Similarity Index Measure (SSIM) loss tailored for dynamic environments, significantly enhancing the system's resilience. Experiments conducted on real-world dynamic datasets demonstrate that the proposed system achieves state-of-the-art performance in camera pose estimation and dense reconstruction in dynamic scenes.
- Abstract(参考訳): 視覚SLAMアルゴリズムは、3次元ガウススプラッティング(3DGS)表現の探索、特に高忠実度高密度マップの生成により、大幅な改善を実現している。
しかし、それらは静的環境の仮定に依存し、動的環境における著しい性能劣化を経験する。
本稿では,GGD-SLAMについて述べる。GGD-SLAMは,動的環境における局所化と高密度マッピングの課題に,事前定義された意味アノテーションや深度入力を使わずに対処するために,一般化可能な運動モデルを利用するフレームワークである。
具体的には、第1次In-First-Out(FIFO)キューを使用して、シーケンシャルアテンション機構を通じて動的セマンティック特徴抽出を容易にする。
これは動的機能拡張器と統合され、静的コンポーネントと動的コンポーネントを分離する。
さらに,静的なコンポーネントに対する動的なイントラクタの影響を最小限に抑えるため,動的環境に適した構造類似度指標(SSIM)を設計し,静的な情報サンプリングによって隠蔽領域を埋める手法を考案し,システムのレジリエンスを著しく向上させる。
実世界の動的データセットを用いた実験により,カメラポーズ推定と動的シーンの高密度再構成において,提案方式が最先端の性能を達成することを示した。
関連論文リスト
- D$^2$GSLAM: 4D Dynamic Gaussian Splatting SLAM [23.45880259388583]
D$2$GSLAMは、動的環境内で正確な動的再構成とロバストな追跡を同時に行う新しい動的SLAMシステムである。
私たちのシステムは4つのキーコンポーネントで構成されています。
論文 参考訳(メタデータ) (2025-12-10T08:12:29Z) - LVD-GS: Gaussian Splatting SLAM for Dynamic Scenes via Hierarchical Explicit-Implicit Representation Collaboration Rendering [21.615484471658842]
3次元ガウス散乱SLAMは空間知能における高忠実度マッピングの手法として広く用いられている。
既存の手法は、大規模でダイナミックな屋外シーンでの性能を制限する単一の表現方式に依存していることが多い。
我々は,新しいLiDAR-Visual 3D Gaussian Splatting SLAMシステムである textbfLVD-GS を提案する。
論文 参考訳(メタデータ) (2025-10-26T13:16:39Z) - Laplacian Analysis Meets Dynamics Modelling: Gaussian Splatting for 4D Reconstruction [9.911802466255653]
本稿では,ハイブリッドな明示的関数を持つ動的3DGSフレームワークを提案する。
本手法は, 複雑な動的シーンを再構築する際の最先端性能を実証し, 再現精度を向上する。
論文 参考訳(メタデータ) (2025-08-07T01:39:29Z) - ADD-SLAM: Adaptive Dynamic Dense SLAM with Gaussian Splatting [12.846353008321394]
ADD-SLAM: ガウス分割に基づくAdaptive Dynamic Dense SLAMフレームワーク。
シーン整合性解析に基づく適応的動的識別機構を設計する。
事前に定義されたセマンティックなカテゴリは必要とせず、シーンのダイナミクスを適応的に発見する。
論文 参考訳(メタデータ) (2025-05-26T02:17:17Z) - WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments [48.51530726697405]
WildGS-SLAMは、動的環境を扱うために設計された、堅牢で効率的な単分子RGB SLAMシステムである。
本研究では,浅い多層パーセプトロンとDINOv2の特徴によって予測される不確実性マップを導入し,追跡とマッピングの両方において動的物体除去を誘導する。
その結果,WildGS-SLAMの動的環境における性能は最先端の手法に比べて優れていた。
論文 参考訳(メタデータ) (2025-04-04T19:19:40Z) - UrbanGS: Semantic-Guided Gaussian Splatting for Urban Scene Reconstruction [86.4386398262018]
UrbanGSは2Dセマンティックマップと既存の動的ガウスアプローチを使って静的オブジェクトとシーンを区別する。
動的オブジェクトに対して、学習可能な時間埋め込みを用いて時間情報を集約する。
提案手法は, 修復の質と効率性において, 最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-12-04T16:59:49Z) - Event-boosted Deformable 3D Gaussians for Dynamic Scene Reconstruction [50.873820265165975]
本稿では,高時間分解能連続運動データと動的シーン再構成のための変形可能な3D-GSを併用したイベントカメラについて紹介する。
本稿では、3次元再構成としきい値モデリングの両方を大幅に改善する相互強化プロセスを作成するGS-Thresholdジョイントモデリング戦略を提案する。
提案手法は,合成および実世界の動的シーンを用いた最初のイベント包摂型4Dベンチマークであり,その上で最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-11-25T08:23:38Z) - Motion-aware 3D Gaussian Splatting for Efficient Dynamic Scene Reconstruction [89.53963284958037]
動的シーン再構築のための新しい動き認識拡張フレームワークを提案する。
具体的には,まず3次元ガウス運動と画素レベルの流れの対応性を確立する。
より厳密な最適化問題を示す先行的な変形に基づくパラダイムに対して,過渡対応変形補助モジュールを提案する。
論文 参考訳(メタデータ) (2024-03-18T03:46:26Z) - Periodic Vibration Gaussian: Dynamic Urban Scene Reconstruction and Real-time Rendering [49.36767999382054]
周期振動ガウスモデル(PVG)を提案する。
PVGは、当初静的シーン表現のために設計された効率的な3Dガウススプラッティング技術に基づいている。
PVGは、最良の代替品よりも900倍の速度でレンダリングできる。
論文 参考訳(メタデータ) (2023-11-30T13:53:50Z) - EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via
Self-Supervision [85.17951804790515]
EmerNeRFは動的駆動シーンの時空間表現を学習するためのシンプルだが強力なアプローチである。
シーンの幾何学、外観、動き、セマンティクスを自己ブートストラップで同時にキャプチャする。
本手法はセンサシミュレーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-11-03T17:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。