論文の概要: NRGS-SLAM: Monocular Non-Rigid SLAM for Endoscopy via Deformation-Aware 3D Gaussian Splatting
- arxiv url: http://arxiv.org/abs/2602.17182v1
- Date: Thu, 19 Feb 2026 09:03:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:28.815656
- Title: NRGS-SLAM: Monocular Non-Rigid SLAM for Endoscopy via Deformation-Aware 3D Gaussian Splatting
- Title(参考訳): NRGS-SLAM:変形を意識した3次元ガウススプラッティングによる内視鏡用単分子非線形SLAM
- Authors: Jiwei Shan, Zeyu Cai, Yirui Li, Yongbo Chen, Lijun Han, Yun-hui Liu, Hesheng Wang, Shing Shin Cheng,
- Abstract要約: 3次元ガウス法による内視鏡用単分子非剛性SLAMシステムNRGS-SLAMを提案する。
NRGS-SLAMは、最先端の手法よりも精度の高いカメラポーズ推定(RMSEの最大50%の削減)と高品質なフォトリアリスティック再構成を実現する。
- 参考スコア(独自算出の注目度): 25.805439969022697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual simultaneous localization and mapping (V-SLAM) is a fundamental capability for autonomous perception and navigation. However, endoscopic scenes violate the rigidity assumption due to persistent soft-tissue deformations, creating a strong coupling ambiguity between camera ego-motion and intrinsic deformation. Although recent monocular non-rigid SLAM methods have made notable progress, they often lack effective decoupling mechanisms and rely on sparse or low-fidelity scene representations, which leads to tracking drift and limited reconstruction quality. To address these limitations, we propose NRGS-SLAM, a monocular non-rigid SLAM system for endoscopy based on 3D Gaussian Splatting. To resolve the coupling ambiguity, we introduce a deformation-aware 3D Gaussian map that augments each Gaussian primitive with a learnable deformation probability, optimized via a Bayesian self-supervision strategy without requiring external non-rigidity labels. Building on this representation, we design a deformable tracking module that performs robust coarse-to-fine pose estimation by prioritizing low-deformation regions, followed by efficient per-frame deformation updates. A carefully designed deformable mapping module progressively expands and refines the map, balancing representational capacity and computational efficiency. In addition, a unified robust geometric loss incorporates external geometric priors to mitigate the inherent ill-posedness of monocular non-rigid SLAM. Extensive experiments on multiple public endoscopic datasets demonstrate that NRGS-SLAM achieves more accurate camera pose estimation (up to 50\% reduction in RMSE) and higher-quality photo-realistic reconstructions than state-of-the-art methods. Comprehensive ablation studies further validate the effectiveness of our key design choices. Source code will be publicly available upon paper acceptance.
- Abstract(参考訳): 視覚的同時ローカライゼーションとマッピング(V-SLAM)は、自律的な知覚とナビゲーションの基本的な機能である。
しかし、内視鏡的シーンは、持続的な軟部変形による剛性仮定に反し、カメラの自我運動と本質的な変形との間に強い結合の曖昧さを生じる。
近年のモノキュラー非剛性SLAM法は顕著な進歩を遂げているが、効果的デカップリング機構が欠如しており、疎度や低忠実度シーン表現に依存しており、ドリフトの追跡や復元品質の制限につながる。
これらの制約に対処するために,3次元ガウススプラッティングに基づく内視鏡用単分子非剛性SLAMシステムNRGS-SLAMを提案する。
結合のあいまいさを解決するために,各ガウスプリミティブを学習可能な変形確率で拡張する変形対応3次元ガウス写像を導入し,外部の非剛性ラベルを必要とせずにベイズ自己超越戦略により最適化する。
この表現に基づいて、低変形領域の優先順位付けとフレーム単位の効率的な変形更新により、頑健な粗いポーズ推定を行う変形可能なトラッキングモジュールを設計する。
慎重に設計された変形可能なマッピングモジュールは、表現能力と計算効率のバランスを取りながら、地図を徐々に拡張し、洗練する。
さらに、統一されたロバストな幾何学的損失は、外的幾何学的先行を組み込んで、単分子非剛体SLAMの固有の不正を緩和する。
複数の公開内視鏡データセットに対する大規模な実験により、NRGS-SLAMは最先端の手法よりも高精度なカメラポーズ推定(RMSEの最大50%の削減)と高品質なフォトリアリスティック再構成を実現している。
包括的アブレーション研究は、我々の重要な設計選択の有効性をさらに検証する。
ソースコードは、論文の受理時に公開される。
関連論文リスト
- ERGO: Excess-Risk-Guided Optimization for High-Fidelity Monocular 3D Gaussian Splatting [63.138778159026934]
本稿では,ERGOと呼ばれる過度のリスク分解によって導かれる適応最適化フレームワークを提案する。
ERGOはビュー固有の過剰リスクを動的に推定し、最適化中の損失重みを適応的に調整する。
Google Scanned ObjectsデータセットとOmniObject3Dデータセットの実験は、既存の最先端メソッドよりもERGOの方が優れていることを示している。
論文 参考訳(メタデータ) (2026-02-10T20:44:43Z) - Moving Light Adaptive Colonoscopy Reconstruction via Illumination-Attenuation-Aware 3D Gaussian Splatting [35.37461816543526]
3D Gaussian Splatting (3DGS) は, 大腸内視鏡におけるリアルタイム視線合成の重要技術として出現している。
しかし、バニラ3DGSは静止照明を仮定し、観測された外観は視角のみに依存する。
このミスマッチは、ほとんどの3DGS法に、カメラと組織の間に、構造に違反するガウスの塊を導入するよう強制する。
大腸内視鏡に適した改良型3DGSフレームワークであるColIAGSを提案する。
論文 参考訳(メタデータ) (2025-10-21T15:44:23Z) - EndoFlow-SLAM: Real-Time Endoscopic SLAM with Flow-Constrained Gaussian Splatting [7.7956059927002705]
光学的フローロスを幾何学的制約として導入し、シーンの3次元構造とカメラモーションの両方を効果的に制約する。
さらに,SLAMシステムにおけるシーン表現を改善するために,キーフレームに対応する視点に着目して3DGSの洗練戦略を改善する。
提案手法は,新しいビュー合成とポーズ推定において,既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2025-06-26T16:06:46Z) - Metropolis-Hastings Sampling for 3D Gaussian Reconstruction [31.840492077537018]
3次元ガウス平滑化のための適応型サンプリングフレームワーク(3DGS)を提案する。
我々の枠組みは, 確率的サンプリングプロセスとして, デンシフィケーションとプルーニングを改質することで限界を克服する。
提案手法は,最先端モデルのビュー合成品質を適度に上回りながら,より高速な収束を実現する。
論文 参考訳(メタデータ) (2025-06-15T19:12:37Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - Mesh-based Gaussian Splatting for Real-time Large-scale Deformation [58.18290393082119]
ユーザがリアルタイムで大きな変形で暗黙の表現を直接変形または操作することは困難である。
我々は,インタラクティブな変形を可能にする新しいGSベースの手法を開発した。
提案手法は,高いフレームレートで良好なレンダリング結果を維持しつつ,高品質な再構成と効率的な変形を実現する。
論文 参考訳(メタデータ) (2024-02-07T12:36:54Z) - Orthogonal Matrix Retrieval with Spatial Consensus for 3D Unknown-View
Tomography [58.60249163402822]
未知視トモグラフィ(UVT)は、未知のランダムな向きで2次元投影から3次元密度マップを再構成する。
提案したOMRはより堅牢で、従来の最先端のOMRアプローチよりも大幅に性能が向上している。
論文 参考訳(メタデータ) (2022-07-06T21:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。