論文の概要: PRISM-SLAM: Probabilistic Ray-Grounded Inference for Scale-aware Metric SLAM
- arxiv url: http://arxiv.org/abs/2605.19257v3
- Date: Wed, 27 May 2026 00:11:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:54.764682
- Title: PRISM-SLAM: Probabilistic Ray-Grounded Inference for Scale-aware Metric SLAM
- Title(参考訳): PRISM-SLAM:スケールアウェアメトリックSLAMの確率的レイグラウンド推論
- Authors: Eunsoo Im, Gyeonggwan Lee, Junghun Suh,
- Abstract要約: PRISM-SLAMは、VFMプリエントを構造化ベイズ因子グラフに厳密に統合するリアルタイムフレームワークである。
我々は,一貫した距離座標系内の絶対空間における単分子観測を固定するために,チャンカー線距離係数を導入する。
VFM推論と幾何追跡を非同期に処理するマルチプロセスアーキテクチャを利用することで、PRISM-SLAMはRGB入力のみを使用して、30FPSで検証済みのメトリック出力を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular SLAM historically suffers from scale ambiguity and tracking failure in dynamic environments. While recent vision foundation models (VFMs) provide remarkable zero-shot depth priors, naively integrating these deterministic predictions ignores predictive uncertainty and frame-to-frame scale inconsistencies. We propose PRISM-SLAM, a real-time framework that rigorously integrates VFM priors into a structured Bayesian factor graph to achieve scale-aware, metric-consistent localization and mapping. Specifically, we introduce a Plücker Ray-Distance Factor to anchor monocular observations in absolute space within a globally consistent metric coordinate system, mathematically resolving scale drift by making the metric scale Fisher-identifiable. To handle environmental dynamics, we derive an epistemic uncertainty proxy from temporal depth consistency and formulate a Dynamic Scene Uncertainty Gating (DSUG) mechanism. This soft-gating approach probabilistically down-weights dynamic distractors without incurring the heavy computational overhead associated with traditional semantic segmentation masks. By employing a multi-process architecture that asynchronously processes VFM inference and geometric tracking, PRISM-SLAM provides verified metric output at 30 FPS using solely RGB input, bridging the gap between foundation models and real-world robotic applications. Evaluated on the TUM RGB-D and 7-Scenes benchmarks, PRISM-SLAM achieves a metric $SE(3)$ Absolute Trajectory Error (ATE) nearly identical to its oracle-aligned $Sim(3)$ error. This demonstrates that our system can produce deployment-ready metric trajectories by delivering robust metric SLAM solutions without any post-hoc scale correction. Project page: https://prismslam-cmd.github.io/prismslam_pr/
- Abstract(参考訳): モノクロSLAMは歴史的に、動的環境におけるスケールの曖昧さと障害の追跡に悩まされてきた。
最近のビジョンファウンデーションモデル(VFM)は、目覚ましいゼロショット深度を先導するが、これらの決定論的予測を統合することは、予測の不確実性やフレーム間スケールの不整合を無視している。
PRISM-SLAMは,VFM先行値を構造化ベイズ因子グラフに厳密に統合し,スケールアウェアで計量一貫性のある局所化とマッピングを実現するリアルタイムフレームワークである。
具体的には,大域的に一貫した座標系内の絶対空間における単分子観測を固定する Plücker Ray-Distance Factor を導入する。
環境動態に対処するため,時間的深さの整合性からエピステマティック不確実性プロキシを導出し,動的シーン不確実性ゲーティング(DSUG)機構を定式化する。
このソフトゲーティングアプローチは、従来のセマンティックセグメンテーションマスクに関連する計算オーバーヘッドを発生させることなく、動的イントラクタを確率的にダウンウェイトする。
VFM推論と幾何追跡を非同期に処理するマルチプロセスアーキテクチャを利用することで、PRISM-SLAMは、RGB入力のみを使用して、30FPSで検証済みのメトリック出力を提供し、基礎モデルと実世界のロボットアプリケーションとのギャップを埋める。
TUM RGB-D と 7-Scenes のベンチマークで評価された PRISM-SLAM は、そのオラクル整列の $Sim(3)$ エラーとほぼ同一の計量 $SE(3)$ Absolute Trajectory Error (ATE) を達成する。
このことから,本システムでは,ポストホックスケール補正を必要とせずに,ロバストなメトリックSLAMソリューションを提供することで,展開可能なメトリックトラジェクトリを作成できることが示される。
プロジェクトページ:https://prismslam-cmd.github.io/prismslam_pr/
関連論文リスト
- DynoSLAM: Dynamic SLAM with Generative Graph Neural Networks for Real-World Social Navigation [1.6504157612470989]
本稿では,ソーシャルなグラフネットワーク(GNN)を要素グラフの最適化に直接統合する動的グラフSLAMアーキテクチャを提案する。
トレーニングされたGNNからのMonte Carloロールアウトを利用して、人間のインタラクションのマルチモーダルな不確実性を捉え、SLAMグラフに埋め込む。
論文 参考訳(メタデータ) (2026-05-04T15:58:08Z) - PoseFM: Relative Camera Pose Estimation Through Flow Matching [0.0]
フローマッチング(FM)を用いた単眼フレーム間VOを生成タスクとして再構成するフレームワークであるPoseFMを提案する。
FM を利用して,カメラの動きを点推定ではなく分布としてモデル化し,連続時間ODE を用いて雑音をリアルなポーズ予測に変換する。
評価において,PoseFMはTartanAir,KITTI,TUM-RGBDベンチマークに対して高い性能を示し,トラジェクトリ上では最小の絶対軌道誤差(ATE)を達成した。
論文 参考訳(メタデータ) (2026-04-24T08:36:53Z) - CoWTracker: Tracking by Warping instead of Correlation [53.834673070954494]
ワープに有利なコストを削減できる高密度な点トラッカーを提案する。
近年の光学的流れの進展に触発されて,本手法では,現在の推定値に基づいて,対象フレームからクエリフレームへ特徴を変換することで,トラック推定を反復的に洗練する。
我々のモデルは,TAP-Vid-DAVIS,TAP-Vid-Kinetics,Robo-TAPなど,標準的な高密度点追跡ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2026-02-04T18:58:59Z) - Why Does the LLM Stop Computing: An Empirical Study of User-Reported Failures in Open-Source LLMs [50.075587392477935]
オープンソースのDeepSeek、Llama、Qwenのエコシステムから、705の現実世界の失敗に関する大規模な実証的研究を行った。
ホワイトボックスオーケストレーションは、モデルアルゴリズムの欠陥からデプロイメントスタックのシステム的脆弱性へと、信頼性のボトルネックを移動させます。
論文 参考訳(メタデータ) (2026-01-20T06:42:56Z) - VFMF: World Modeling by Forecasting Vision Foundation Model Features [67.09340259579761]
本稿では,視覚基礎モデルの特徴空間における自己回帰フローマッチングを行う生成予測器を提案する。
この潜伏情報の方がPCAベースの代替案よりも効果的であることを示す。
一致したアーキテクチャと計算により、本手法はすべてのモダリティにおける回帰よりもシャープで正確な予測を生成する。
論文 参考訳(メタデータ) (2025-12-12T02:10:05Z) - MASt3R-Fusion: Integrating Feed-Forward Visual Model with IMU, GNSS for High-Functionality SLAM [12.158063913401575]
フィードフォワード・ポイントマップ・レグレッションと相補的なセンサ情報を統合するマルチセンサ支援視覚SLAMフレームワークMASt3R-Fusionを提案する。
実時間スライディングウインドウ最適化とアグレッシブループ閉鎖を伴う大域的最適化の両立が可能な階層的因子グラフ設計法を開発した。
我々は、公開ベンチマークと自己収集データセットの両方に対するアプローチを評価し、精度とロバスト性を大幅に改善したことを示す。
論文 参考訳(メタデータ) (2025-09-25T05:26:28Z) - MCGS-SLAM: A Multi-Camera SLAM Framework Using Gaussian Splatting for High-Fidelity Mapping [52.99503784067417]
3次元ガウス平板上に構築した初のRGBベースのマルチカメラSLAMシステムMCGS-SLAM(3DGS)を提案する。
マルチカメラバンドル調整(MCBA)は、高密度の測光および幾何残差を介してポーズと深さを共同で洗練し、スケール整合モジュールはビューを横断する計量アライメントを強制する。
合成および実世界のデータセットの実験は、MCGS-SLAMが一貫して正確な軌道と光現実的再構成をもたらすことを示している。
論文 参考訳(メタデータ) (2025-09-17T17:27:53Z) - TVG-SLAM: Robust Gaussian Splatting SLAM with Tri-view Geometric Constraints [22.121665995381324]
TVG-SLAMはRGBのみの堅牢な3DGS SLAMシステムである。
本手法はロバスト性を向上し,平均的絶対軌道誤差(ATE)を69.0%削減し,最先端のレンダリング品質を実現する。
論文 参考訳(メタデータ) (2025-06-29T12:31:05Z) - Using Detection, Tracking and Prediction in Visual SLAM to Achieve
Real-time Semantic Mapping of Dynamic Scenarios [70.70421502784598]
RDS-SLAMは、一般的に使用されているIntel Core i7 CPUのみを使用して、動的シナリオのためのオブジェクトレベルでのセマンティックマップをリアルタイムで構築することができる。
我々は, TUM RGB-DデータセットにおけるRDS-SLAMを評価し, 動的シナリオにおいて, RDS-SLAMはフレームあたり30.3msで動作可能であることを示した。
論文 参考訳(メタデータ) (2022-10-10T11:03:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。