論文の概要: NeuV-SLAM: Fast Neural Multiresolution Voxel Optimization for RGBD Dense
SLAM
- arxiv url: http://arxiv.org/abs/2402.02020v1
- Date: Sat, 3 Feb 2024 04:26:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 22:51:03.710461
- Title: NeuV-SLAM: Fast Neural Multiresolution Voxel Optimization for RGBD Dense
SLAM
- Title(参考訳): NeuV-SLAM:RGBD高密度SLAMのための高速ニューラルネットワーク多分解能ボクセル最適化
- Authors: Wenzhi Guo, Bing Wang, Lijun Chen
- Abstract要約: ニュートラルV-SLAMは,ニュートラル多分解能ボクセルをベースとした,新しい局所化とマッピングパイプラインである。
NeuV-SLAMは超高速収束とインクリメンタル展開機能によって特徴付けられる。
- 参考スコア(独自算出の注目度): 5.709880146357355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce NeuV-SLAM, a novel dense simultaneous localization and mapping
pipeline based on neural multiresolution voxels, characterized by ultra-fast
convergence and incremental expansion capabilities. This pipeline utilizes RGBD
images as input to construct multiresolution neural voxels, achieving rapid
convergence while maintaining robust incremental scene reconstruction and
camera tracking. Central to our methodology is to propose a novel implicit
representation, termed VDF that combines the implementation of neural signed
distance field (SDF) voxels with an SDF activation strategy. This approach
entails the direct optimization of color features and SDF values anchored
within the voxels, substantially enhancing the rate of scene convergence. To
ensure the acquisition of clear edge delineation, SDF activation is designed,
which maintains exemplary scene representation fidelity even under constraints
of voxel resolution. Furthermore, in pursuit of advancing rapid incremental
expansion with low computational overhead, we developed hashMV, a novel
hash-based multiresolution voxel management structure. This architecture is
complemented by a strategically designed voxel generation technique that
synergizes with a two-dimensional scene prior. Our empirical evaluations,
conducted on the Replica and ScanNet Datasets, substantiate NeuV-SLAM's
exceptional efficacy in terms of convergence speed, tracking accuracy, scene
reconstruction, and rendering quality.
- Abstract(参考訳): ニュートラルV-SLAMは,超高速収束とインクリメンタル展開機能によって特徴付けられる,ニュートラル多分解能ボクセルに基づく新しい高密度同時局在およびマッピングパイプラインである。
このパイプラインでは、rgbdイメージを入力として多解像度ニューラルネットワークボクセルを構築し、堅牢なインクリメンタルなシーン再構成とカメラトラッキングを維持しながら、迅速な収束を実現する。
我々の方法論の中心は、神経署名距離場(SDF)ボクセルとSDF活性化戦略を組み合わせた、新しい暗黙的表現であるVDFを提案することである。
このアプローチでは,ボクセル内に固定された色特徴とSDF値を直接最適化し,シーン収束率を大幅に向上させる。
鮮明なエッジデラインの取得を保証するため, ボクセル解像度の制約下においても, SDFアクティベーションは模範的なシーン表現の忠実性を維持する。
さらに,計算オーバーヘッドの少ない急激な漸進的拡張を追求するために,ハッシュベースの新しいマルチレゾリューションボクセル管理構造であるhashMVを開発した。
このアーキテクチャは、2次元のシーンと相乗効果を持つ戦略的に設計されたボクセル生成技術によって補完される。
再現およびスキャンネットデータセット上で実施した実験評価では, 収束速度, 追跡精度, シーン再構成, レンダリング品質の点で, ニューウオ・スラムの例外的有効性を検証した。
関連論文リスト
- Event-Stream Super Resolution using Sigma-Delta Neural Network [0.10923877073891444]
イベントカメラは、それらが収集するデータの低解像度で疎結合で非同期な性質のため、ユニークな課題を示す。
現在のイベント超解像アルゴリズムは、イベントカメラによって生成された異なるデータ構造に対して完全に最適化されていない。
バイナリスパイクをSigma Delta Neural Networks(SDNNs)と統合する手法を提案する
論文 参考訳(メタデータ) (2024-08-13T15:25:18Z) - Low-Light Video Enhancement via Spatial-Temporal Consistent Illumination and Reflection Decomposition [68.6707284662443]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的および静的なシーンの復元を目指している。
1つの重要な側面は、時間空間照明と外観強化バージョンに特化した一貫性の制約を定式化することである。
本稿では,レチネックスを基盤とした革新的なビデオ分解戦略について述べる。
論文 参考訳(メタデータ) (2024-05-24T15:56:40Z) - VoxNeRF: Bridging Voxel Representation and Neural Radiance Fields for
Enhanced Indoor View Synthesis [51.49008959209671]
本稿では,室内ビュー合成の品質と効率を高めるために,ボリューム表現を活用する新しいアプローチであるVoxNeRFを紹介する。
我々は,空間的特徴を適応的に捉えるためにマルチレゾリューション・ハッシュ・グリッドを使用し,室内シーンの閉塞や複雑な形状を効果的に管理する。
我々は,3つの屋内データセットに対するアプローチを検証するとともに,VoxNeRFが最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-11-09T11:32:49Z) - Anti-Aliased Neural Implicit Surfaces with Encoding Level of Detail [54.03399077258403]
本稿では,高頻度幾何細部リカバリとアンチエイリアス化された新しいビューレンダリングのための効率的なニューラル表現であるLoD-NeuSを提案する。
我々の表現は、光線に沿った円錐状のフラストラム内の多面体化から空間特徴を集約する。
論文 参考訳(メタデータ) (2023-09-19T05:44:00Z) - Fast Monocular Scene Reconstruction with Global-Sparse Local-Dense Grids [84.90863397388776]
本稿では,スパルス・ボクセル・ブロック・グリッドにおける署名付き距離関数(SDF)を直接使用して,距離のない高速かつ正確なシーン再構成を実現することを提案する。
我々の世界規模で疎密で局所的なデータ構造は、表面の空間的空間性を利用して、キャッシュフレンドリーなクエリを可能にし、マルチモーダルデータへの直接拡張を可能にします。
実験により、我々のアプローチはトレーニングでは10倍、レンダリングでは100倍高速であり、最先端のニューラル暗黙法に匹敵する精度を実現していることがわかった。
論文 参考訳(メタデータ) (2023-05-22T16:50:19Z) - Direct Voxel Grid Optimization: Super-fast Convergence for Radiance
Fields Reconstruction [42.3230709881297]
画像の集合からシーンごとの放射界を再構成する超高速収束手法を提案する。
提案手法はNeRFに比較可能な品質を実現し,1つのGPUで15分以内でスクラッチから急速に収束する。
論文 参考訳(メタデータ) (2021-11-22T14:02:07Z) - Optical-Flow-Reuse-Based Bidirectional Recurrent Network for Space-Time
Video Super-Resolution [52.899234731501075]
時空間ビデオ超解像(ST-VSR)は、与えられたビデオの空間解像度とフレームレートを同時に増加させる。
既存の手法は通常、近隣の幅広いフレームからの情報を効率的に活用する方法の難しさに悩まされる。
本稿では,隣接するフレーム間の知識を活用するために,ConvLSTMの代わりに粗大な双方向リカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-13T15:21:30Z) - NerfingMVS: Guided Optimization of Neural Radiance Fields for Indoor
Multi-view Stereo [97.07453889070574]
本稿では,従来のSfM再構成と学習に基づく先行手法を併用した多視点深度推定手法を提案する。
提案手法は室内シーンにおける最先端手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2021-09-02T17:54:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。