論文の概要: SLAIM: Robust Dense Neural SLAM for Online Tracking and Mapping
- arxiv url: http://arxiv.org/abs/2404.11419v1
- Date: Wed, 17 Apr 2024 14:23:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-18 13:45:12.000166
- Title: SLAIM: Robust Dense Neural SLAM for Online Tracking and Mapping
- Title(参考訳): SLAIM: オンライントラッキングとマッピングのためのロバストディエンスニューラルネットワークSLAM
- Authors: Vincent Cartillier, Grant Schindler, Irfan Essa,
- Abstract要約: ニューラルラジアンスフィールドSLAM(NeRF-SLAM)に適した,新しい粗い粒度追跡モデルを提案する。
既存の NeRF-SLAM システムは、従来の SLAM アルゴリズムに比べて、追跡性能が劣っている。
局所バンドル調整とグローバルバンドル調整の両方を実装し、ロバストな(粗大な)(KL正規化器)と正確な(KL正規化器)SLAMソリューションを生成する。
- 参考スコア(独自算出の注目度): 15.63276368052395
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We present SLAIM - Simultaneous Localization and Implicit Mapping. We propose a novel coarse-to-fine tracking model tailored for Neural Radiance Field SLAM (NeRF-SLAM) to achieve state-of-the-art tracking performance. Notably, existing NeRF-SLAM systems consistently exhibit inferior tracking performance compared to traditional SLAM algorithms. NeRF-SLAM methods solve camera tracking via image alignment and photometric bundle-adjustment. Such optimization processes are difficult to optimize due to the narrow basin of attraction of the optimization loss in image space (local minima) and the lack of initial correspondences. We mitigate these limitations by implementing a Gaussian pyramid filter on top of NeRF, facilitating a coarse-to-fine tracking optimization strategy. Furthermore, NeRF systems encounter challenges in converging to the right geometry with limited input views. While prior approaches use a Signed-Distance Function (SDF)-based NeRF and directly supervise SDF values by approximating ground truth SDF through depth measurements, this often results in suboptimal geometry. In contrast, our method employs a volume density representation and introduces a novel KL regularizer on the ray termination distribution, constraining scene geometry to consist of empty space and opaque surfaces. Our solution implements both local and global bundle-adjustment to produce a robust (coarse-to-fine) and accurate (KL regularizer) SLAM solution. We conduct experiments on multiple datasets (ScanNet, TUM, Replica) showing state-of-the-art results in tracking and in reconstruction accuracy.
- Abstract(参考訳): SLAIM - 同時局所化とインシシットマッピングを提案する。
本稿では,Neural Radiance Field SLAM (NeRF-SLAM) に適したサース・ツー・ファイントラッキングモデルを提案する。
特に、既存のNeRF-SLAMシステムでは、従来のSLAMアルゴリズムと比較して、追跡性能が劣っている。
NeRF-SLAM法は、画像アライメントと光度バンドル調整によるカメラトラッキングを解決する。
このような最適化プロセスは、画像空間(局所最小値)の最適化損失と初期対応の欠如により、アトラクションが狭くなり、最適化が困難である。
我々はこれらの制限を、NeRF上にガウスピラミッドフィルタを実装することで緩和し、粗い追従最適化戦略を容易にする。
さらに、NeRFシステムは入力ビューが制限された正しい幾何学に収束する際の課題に直面する。
従来の手法では、符号距離関数(Signed-Distance Function, SDF)をベースとしたNeRFを用いて、深度測定により地上の真理SDFを近似することで直接SDF値を監督するが、これはしばしば準最適幾何をもたらす。
対照的に、本手法は体積密度表現を用い、光終端分布に新しいKL正規化器を導入し、空空間と不透明表面からなるシーン幾何学を制約する。
我々のソリューションは, 局所的およびグローバルなバンドル調整を実装し, 頑健(粗大)かつ正確な(KL正規化器)SLAMソリューションを生成する。
我々は、複数のデータセット(ScanNet、TUM、Replica)で、追跡と復元の精度に関する最先端の結果を示す実験を行う。
関連論文リスト
- Generalizable Non-Line-of-Sight Imaging with Learnable Physical Priors [52.195637608631955]
非視線画像(NLOS)は、その潜在的な応用により注目されている。
既存のNLOS再構成アプローチは、経験的物理的前提に依存して制約される。
本稿では,Learningable Path Compensation(LPC)とAdaptive Phasor Field(APF)の2つの主要な設計を含む,学習に基づく新しいソリューションを提案する。
論文 参考訳(メタデータ) (2024-09-21T04:39:45Z) - KFD-NeRF: Rethinking Dynamic NeRF with Kalman Filter [49.85369344101118]
KFD-NeRFは,Kalmanフィルタに基づく効率的かつ高品質な運動再構成フレームワークと統合された,新しい動的ニューラル放射場である。
我々のキーとなる考え方は、動的放射場を、観測と予測という2つの知識源に基づいて時間的に異なる状態が推定される動的システムとしてモデル化することである。
我々のKFD-NeRFは、同等の計算時間と最先端の視線合成性能で、徹底的な訓練を施した類似または優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-18T05:48:24Z) - CG-SLAM: Efficient Dense RGB-D SLAM in a Consistent Uncertainty-aware 3D Gaussian Field [46.8198987091734]
本稿では,新しい不確実性を考慮した3次元ガウス場に基づく高密度RGB-D SLAMシステム,すなわちCG-SLAMを提案する。
各種データセットの実験により、CG-SLAMは、最大15Hzの追従速度で優れた追従性能とマッピング性能を達成することが示された。
論文 参考訳(メタデータ) (2024-03-24T11:19:59Z) - High-Fidelity SLAM Using Gaussian Splatting with Rendering-Guided Densification and Regularized Optimization [8.845446246585215]
本稿では,3次元ガウススプラッティングに基づく高密度RGBD SLAMシステムを提案する。
近年のニューラルかつ並列に開発されたガウススプラッティング RGBD SLAM ベースラインと比較して,本手法は合成データセット Replica の最先端結果と実世界のデータセット TUM の競合結果を得る。
論文 参考訳(メタデータ) (2024-03-19T08:19:53Z) - SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM [5.144010652281121]
SGS-SLAMはSplattingに基づく最初の意味的視覚的SLAMシステムである。
外観幾何学とマルチチャネル最適化による意味的特徴は、ニューラル暗黙のSLAMシステムの過度な制限に対処する。
カメラポーズ推定、マップ再構成、正確なセマンティックセグメンテーション、およびオブジェクトレベルの幾何精度において最先端のパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-02-05T18:03:53Z) - PNeRFLoc: Visual Localization with Point-based Neural Radiance Fields [54.8553158441296]
統一された点ベース表現に基づく新しい視覚的ローカライゼーションフレームワーク PNeRFLoc を提案する。
一方、PNeRFLocは2次元特徴点と3次元特徴点をマッチングして初期ポーズ推定をサポートする。
一方、レンダリングベースの最適化を用いた新しいビュー合成によるポーズ改善も実現している。
論文 参考訳(メタデータ) (2023-12-17T08:30:00Z) - NICER-SLAM: Neural Implicit Scene Encoding for RGB SLAM [111.83168930989503]
NICER-SLAMは、カメラポーズと階層的なニューラル暗黙マップ表現を同時に最適化するRGB SLAMシステムである。
近年のRGB-D SLAMシステムと競合する高密度マッピング,追跡,新しいビュー合成において,高い性能を示す。
論文 参考訳(メタデータ) (2023-02-07T17:06:34Z) - NerfingMVS: Guided Optimization of Neural Radiance Fields for Indoor
Multi-view Stereo [97.07453889070574]
本稿では,従来のSfM再構成と学習に基づく先行手法を併用した多視点深度推定手法を提案する。
提案手法は室内シーンにおける最先端手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2021-09-02T17:54:31Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。