Fugu-MT 論文翻訳(概要): Uni-SLAM: Uncertainty-Aware Neural Implicit SLAM for Real-Time Dense Indoor Scene Reconstruction

論文の概要: Uni-SLAM: Uncertainty-Aware Neural Implicit SLAM for Real-Time Dense Indoor Scene Reconstruction

arxiv url: http://arxiv.org/abs/2412.00242v1
Date: Fri, 29 Nov 2024 20:16:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-04 21:11:21.641082
Title: Uni-SLAM: Uncertainty-Aware Neural Implicit SLAM for Real-Time Dense Indoor Scene Reconstruction
Title（参考訳）: Uni-SLAM: リアルタイム屋内シーン再構築のための不確かさを意識したニューラルインシシデントSLAM
Authors: Shaoxiang Wang, Yaxu Xie, Chun-Peng Chang, Christen Millerdurai, Alain Pagani, Didier Stricker,
Abstract要約: 屋内再構成のためのハッシュグリッドに基づく3次元空間表現であるUni-SLAMを提案する。合成および実世界のデータセットの実験により、我々のシステムは最先端の追跡とマッピングの精度を達成できることを示した。
参考スコア（独自算出の注目度）: 11.714682609560278
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Neural implicit fields have recently emerged as a powerful representation method for multi-view surface reconstruction due to their simplicity and state-of-the-art performance. However, reconstructing thin structures of indoor scenes while ensuring real-time performance remains a challenge for dense visual SLAM systems. Previous methods do not consider varying quality of input RGB-D data and employ fixed-frequency mapping process to reconstruct the scene, which could result in the loss of valuable information in some frames. In this paper, we propose Uni-SLAM, a decoupled 3D spatial representation based on hash grids for indoor reconstruction. We introduce a novel defined predictive uncertainty to reweight the loss function, along with strategic local-to-global bundle adjustment. Experiments on synthetic and real-world datasets demonstrate that our system achieves state-of-the-art tracking and mapping accuracy while maintaining real-time performance. It significantly improves over current methods with a 25% reduction in depth L1 error and a 66.86% completion rate within 1 cm on the Replica dataset, reflecting a more accurate reconstruction of thin structures. Project page: https://shaoxiang777.github.io/project/uni-slam/
Abstract（参考訳）: ニューラル暗黙の場は、その単純さと最先端の性能から、多面的表面再構成の強力な表現方法として最近登場した。しかし, 室内シーンの細い構造を再構築し, リアルタイム性能を確保することは, 密集した視覚SLAMシステムの課題である。従来は、入力RGB-Dデータの様々な品質を考慮せず、シーンを再構築するために固定周波数マッピングプロセスを採用しており、一部のフレームで貴重な情報が失われる可能性がある。本論文では,屋内再構成のためのハッシュグリッドに基づく3次元空間表現であるUni-SLAMを提案する。本稿では,損失関数を再重み付けする新たな予測不確実性と,局所-グローバルバンドルの戦略的調整を導入する。合成および実世界のデータセットを用いた実験により,我々のシステムはリアルタイム性能を維持しつつ,最先端の追跡とマッピングの精度を達成できることを示した。深さL1の誤差が25%減少し、Replicaデータセットの1cm以内の完成率66.86%で現在の方法よりも大幅に改善され、細い構造のより正確な再構築を反映している。プロジェクトページ: https://shaoxiang777.github.io/project/uni-slam/

関連論文リスト

Pseudo Depth Meets Gaussian: A Feed-forward RGB SLAM Baseline [64.42938561167402]
本稿では,3次元ガウス型SLAMとフィードフォワードリカレント予測モジュールを組み合わせたオンライン3次元再構成手法を提案する。このアプローチは、遅いテスト時間の最適化を高速なネットワーク推論に置き換え、トラッキング速度を大幅に改善する。提案手法は,最先端のSplaTAMと同等の性能を示しながら,追跡時間を90%以上削減する。
論文参考訳（メタデータ） (2025-08-06T16:16:58Z)
SparseRecon: Neural Implicit Surface Reconstruction from Sparse Views with Feature and Depth Consistencies [48.99420012507374]
SparseReconは、ボリュームレンダリングに基づく特徴整合性と不確実性誘導深度制約を有するスパースビューのニューラル暗黙的再構成手法である。提案手法は,スパースビュー入力による高品質な幾何を生成できる最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-08-01T06:51:32Z)
R3GS: Gaussian Splatting for Robust Reconstruction and Relocalization in Unconstrained Image Collections [9.633163304379861]
R3GSは、制約のないデータセットに適した堅牢な再構築と再ローカライゼーションフレームワークである。過渡的物体の復元過程に対する悪影響を軽減するため,軽量な人検出ネットワークを構築した。本研究では,屋外シーンにおける空域の課題に対処するために,事前の奥行きを制約として組み込んだ効果的なスカイハンドリング手法を提案する。
論文参考訳（メタデータ） (2025-05-21T09:25:22Z)
Decompositional Neural Scene Reconstruction with Generative Diffusion Prior [64.71091831762214]
完全な形状と詳細なテクスチャを持つ3次元シーンの分解的再構成は、下流の応用に興味深い。近年のアプローチでは、この問題に対処するために意味的あるいは幾何学的正則化が取り入れられているが、制約の少ない領域では著しく劣化している。本稿では,SDS(Score Distillation Sampling)の形で拡散先行値を用いたDP-Reconを提案し,新しい視点下で個々の物体の神経表現を最適化する。
論文参考訳（メタデータ） (2025-03-19T02:11:31Z)
SP-SLAM: Neural Real-Time Dense SLAM With Scene Priors [32.42183561158492]
本稿では,SP-SLAMを提案する。SP-SLAMは,リアルタイムにトラッキングとマッピングを行う新しいRGB-D SLAMシステムである。 SP-SLAMでは,実行中のすべての過去の入力フレームのポーズを連続的に最適化する,マッピングの効果的な最適化戦略を導入する。その結果, 従来の手法と比較して, 高速に動作しながら, トラッキング精度, 復元精度が向上していることがわかった。
論文参考訳（メタデータ） (2025-01-11T07:53:58Z)
NeSLAM: Neural Implicit Mapping and Self-Supervised Feature Tracking With Depth Completion and Denoising [23.876281686625134]
我々は,高精度で密度の高い深度推定,ロバストなカメラトラッキング,新しいビューの現実的な合成を実現するフレームワークNeSLAMを提案する。各種屋内データセットを用いた実験は、再構築、品質追跡、新しいビュー合成におけるシステムの有効性と精度を示す。
論文参考訳（メタデータ） (2024-03-29T07:59:37Z)
DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文参考訳（メタデータ） (2023-11-30T21:34:44Z)
GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文参考訳（メタデータ） (2023-11-20T12:08:23Z)
GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction [45.49960166785063]
GO-SLAMは、リアルタイムでポーズと3D再構成をグローバルに最適化するディープラーニングベースの高密度ビジュアルSLAMフレームワークである。さまざまな合成および実世界のデータセットの結果から、GO-SLAMはロバスト性や復元精度の追跡において最先端のアプローチよりも優れていることが示されている。
論文参考訳（メタデータ） (2023-09-05T17:59:58Z)
Fast Monocular Scene Reconstruction with Global-Sparse Local-Dense Grids [84.90863397388776]
本稿では,スパルス・ボクセル・ブロック・グリッドにおける署名付き距離関数(SDF)を直接使用して,距離のない高速かつ正確なシーン再構成を実現することを提案する。我々の世界規模で疎密で局所的なデータ構造は、表面の空間的空間性を利用して、キャッシュフレンドリーなクエリを可能にし、マルチモーダルデータへの直接拡張を可能にします。実験により、我々のアプローチはトレーニングでは10倍、レンダリングでは100倍高速であり、最先端のニューラル暗黙法に匹敵する精度を実現していることがわかった。
論文参考訳（メタデータ） (2023-05-22T16:50:19Z)
VolRecon: Volume Rendering of Signed Ray Distance Functions for Generalizable Multi-View Reconstruction [64.09702079593372]
VolRecon は Signed Ray Distance Function (SRDF) を用いた新しい一般化可能な暗黙的再構成法である DTUデータセットでは、VolReconはスパースビュー再構築においてSparseNeuSを約30%上回り、フルビュー再構築においてMVSNetと同等の精度を達成する。
論文参考訳（メタデータ） (2022-12-15T18:59:54Z)
NeuralBlox: Real-Time Neural Representation Fusion for Robust Volumetric Mapping [29.3378360000956]
本稿では,ニューラル暗黙表現の最近の進歩を活かした新しい3次元マッピング手法を提案する。ニューラルな暗黙表現をインクリメンタルに構築し、更新するための融合戦略とトレーニングパイプラインを提案する。インクリメンタルに構築された占有マップは,CPU上でもリアルタイムに取得可能であることを示す。
論文参考訳（メタデータ） (2021-10-18T15:45:05Z)
SCFusion: Real-time Incremental Scene Reconstruction with Semantic Completion [86.77318031029404]
本研究では,シーン再構成とセマンティックシーン補完を段階的かつリアルタイムに共同で行うフレームワークを提案する。我々のフレームワークは、3Dグローバルモデルでセマンティックコンプリートを正確かつ効率的に融合させるために、占有マップを処理し、ボクセル状態を活用するように設計された新しいニューラルアーキテクチャに依存している。
論文参考訳（メタデータ） (2020-10-26T15:31:52Z)
Object-based Illumination Estimation with Rendering-aware Neural Networks [56.01734918693844]
個々の物体とその局所画像領域のRGBD外観から高速環境光推定手法を提案する。推定照明により、仮想オブジェクトは実際のシーンと一貫性のあるシェーディングでARシナリオでレンダリングできる。
論文参考訳（メタデータ） (2020-08-06T08:23:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。