論文の概要: HS-SLAM: Hybrid Representation with Structural Supervision for Improved Dense SLAM
- arxiv url: http://arxiv.org/abs/2503.21778v1
- Date: Thu, 27 Mar 2025 17:59:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 18:49:11.662222
- Title: HS-SLAM: Hybrid Representation with Structural Supervision for Improved Dense SLAM
- Title(参考訳): HS-SLAM:高密度SLAMのための構造的スーパービジョンによるハイブリッド表現
- Authors: Ziren Gong, Fabio Tosi, Youmin Zhang, Stefano Mattoccia, Matteo Poggi,
- Abstract要約: NeRFベースのSLAMは、最近、追跡と再構築において有望な成果を上げている。
これらの問題に対処するためにHS-SLAMを提案する。
本稿では,ハッシュグリッド,トリプレーン,ワンブロブの相補的強みを組み合わせたハイブリッド符号化ネットワークを提案する。
- 参考スコア(独自算出の注目度): 38.82194947459594
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: NeRF-based SLAM has recently achieved promising results in tracking and reconstruction. However, existing methods face challenges in providing sufficient scene representation, capturing structural information, and maintaining global consistency in scenes emerging significant movement or being forgotten. To this end, we present HS-SLAM to tackle these problems. To enhance scene representation capacity, we propose a hybrid encoding network that combines the complementary strengths of hash-grid, tri-planes, and one-blob, improving the completeness and smoothness of reconstruction. Additionally, we introduce structural supervision by sampling patches of non-local pixels rather than individual rays to better capture the scene structure. To ensure global consistency, we implement an active global bundle adjustment (BA) to eliminate camera drifts and mitigate accumulative errors. Experimental results demonstrate that HS-SLAM outperforms the baselines in tracking and reconstruction accuracy while maintaining the efficiency required for robotics.
- Abstract(参考訳): NeRFベースのSLAMは、最近、追跡と再構築において有望な成果を上げている。
しかし、既存の手法では、十分なシーン表現の提供、構造情報の取得、重要な動きや忘れられたシーンにおけるグローバルな一貫性の維持といった課題に直面している。
この目的のために,これらの問題に対処するためのHS-SLAMを提案する。
シーン表現能力を向上させるために,ハッシュグリッド,トリプレーン,ワンブロブの相補的な強度を組み合わせたハイブリッド符号化ネットワークを提案する。
さらに、シーン構造をよりよく捉えるために、個々の光線ではなく、非局所画素のパッチをサンプリングすることで、構造的監視を導入する。
グローバルな整合性を確保するため,カメラのドリフトをなくし,累積誤差を軽減するために,アクティブなグローバルバンドル調整(BA)を実装した。
実験結果から, HS-SLAMは, ロボット工学に必要な効率を維持しつつ, トラッキングと再構築の精度において, ベースラインよりも優れていることが示された。
関連論文リスト
- Deblur Gaussian Splatting SLAM [57.35366732452066]
Deblur-SLAMは、モーションブルーの入力から鋭い復元を回復するために設計された堅牢なRGB SLAMパイプラインである。
我々は、動きブル画像の物理画像形成過程をモデル化し、観察されたぼやけた画像とぼやけた画像との誤差を最小化する。
我々は,合成および実世界のぼやけた入力データを用いて,シャープマップ推定とサブフレームトラジェクトリ回復のための最先端結果を得る。
論文 参考訳(メタデータ) (2025-03-16T16:59:51Z) - Evolving High-Quality Rendering and Reconstruction in a Unified Framework with Contribution-Adaptive Regularization [27.509109317973817]
3D Gaussian Splatting (3DGS)は、高品質なレンダリングと高速な推論速度で注目されている。
従来の手法は主に幾何学的正則化に焦点を当てており、プリミティブベースのフレームワークやデュアルモデルフレームワークを含む一般的なアプローチがある。
本稿では,高画質表面再構成を実現するために,適応正規化を利用した統一モデルであるCarGSを提案する。
論文 参考訳(メタデータ) (2025-03-02T12:51:38Z) - Unleashing Correlation and Continuity for Hyperspectral Reconstruction from RGB Images [64.80875911446937]
RGB画像からのHSI再構成のための相関連続性ネットワーク(CCNet)を提案する。
局所スペクトルの相関について,GrSCM(Group-wise Spectral correlation Modeling)モジュールを紹介する。
グローバルスペクトルの連続性のために、我々はNeSCMモジュールを設計する。
論文 参考訳(メタデータ) (2025-01-02T15:14:40Z) - SMORE: Simulataneous Map and Object REconstruction [66.66729715211642]
本稿では,LiDARから大規模都市景観を動的に再現する手法を提案する。
我々は、世界が厳格に動く物体と背景に分解される動的なシーンの構成モデルを総合的に捉え、最適化する。
論文 参考訳(メタデータ) (2024-06-19T23:53:31Z) - MG-SLAM: Structure Gaussian Splatting SLAM with Manhattan World Hypothesis [11.324845082176559]
幾何学的精度と完全性を向上させるRGB-DシステムであるManhattan Gaussian SLAMを提案する。
構成されたシーンから抽出された融合線分をシームレスに統合することにより,テクスチャレス屋内領域におけるロバストなトラッキングを実現する。
合成シーンと実世界のシーンの両方で行われた実験は、これらの進歩により、我々の手法が最先端のパフォーマンスを達成できることを実証している。
論文 参考訳(メタデータ) (2024-05-30T13:16:17Z) - Low-Light Video Enhancement via Spatial-Temporal Consistent Illumination and Reflection Decomposition [68.6707284662443]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的および静的なシーンの復元を目指している。
1つの重要な側面は、時間空間照明と外観強化バージョンに特化した一貫性の制約を定式化することである。
本稿では,レチネックスを基盤とした革新的なビデオ分解戦略について述べる。
論文 参考訳(メタデータ) (2024-05-24T15:56:40Z) - SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM [5.144010652281121]
SGS-SLAMはSplattingに基づく最初の意味的視覚的SLAMシステムである。
外観幾何学とマルチチャネル最適化による意味的特徴は、ニューラル暗黙のSLAMシステムの過度な制限に対処する。
カメラポーズ推定、マップ再構成、正確なセマンティックセグメンテーション、およびオブジェクトレベルの幾何精度において最先端のパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-02-05T18:03:53Z) - GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction [45.49960166785063]
GO-SLAMは、リアルタイムでポーズと3D再構成をグローバルに最適化するディープラーニングベースの高密度ビジュアルSLAMフレームワークである。
さまざまな合成および実世界のデータセットの結果から、GO-SLAMはロバスト性や復元精度の追跡において最先端のアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2023-09-05T17:59:58Z) - Co-SLAM: Joint Coordinate and Sparse Parametric Encodings for Neural
Real-Time SLAM [14.56883275492083]
Co-SLAMはハイブリッド表現に基づくRGB-D SLAMシステムである。
堅牢なカメラ追跡と高忠実な表面再構成をリアルタイムで行う。
論文 参考訳(メタデータ) (2023-04-27T17:46:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。