論文の概要: H-SLAM: Hybrid Direct-Indirect Visual SLAM
- arxiv url: http://arxiv.org/abs/2306.07363v1
- Date: Mon, 12 Jun 2023 18:39:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 16:08:37.663605
- Title: H-SLAM: Hybrid Direct-Indirect Visual SLAM
- Title(参考訳): H-SLAM:ハイブリッド直接間接視覚SLAM
- Authors: Georges Younes, Douaa Khalil, John Zelek, Daniel Asmar
- Abstract要約: 本稿では,1つの逆深度シーン表現を生成するために記述子共有を利用する新しい手法を提案する。
この表現は局所的に使用することができ、ループクロージャを実行するためにグローバルにクエリされ、以前に観測されたマップポイントを再活性化する機能を持つ。
提案手法で生成したマップは互いにドリフトを示さず,他の単分子SLAMシステムに必要な計算コストとメモリフットプリントのごく一部で計算できる。
- 参考スコア(独自算出の注目度): 1.1470070927586016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent success of hybrid methods in monocular odometry has led to many
attempts to generalize the performance gains to hybrid monocular SLAM. However,
most attempts fall short in several respects, with the most prominent issue
being the need for two different map representations (local and global maps),
with each requiring different, computationally expensive, and often redundant
processes to maintain. Moreover, these maps tend to drift with respect to each
other, resulting in contradicting pose and scene estimates, and leading to
catastrophic failure. In this paper, we propose a novel approach that makes use
of descriptor sharing to generate a single inverse depth scene representation.
This representation can be used locally, queried globally to perform loop
closure, and has the ability to re-activate previously observed map points
after redundant points are marginalized from the local map, eliminating the
need for separate and redundant map maintenance processes. The maps generated
by our method exhibit no drift between each other, and can be computed at a
fraction of the computational cost and memory footprint required by other
monocular SLAM systems. Despite the reduced resource requirements, the proposed
approach maintains its robustness and accuracy, delivering performance
comparable to state-of-the-art SLAM methods (e.g., LDSO, ORB-SLAM3) on the
majority of sequences from well-known datasets like EuRoC, KITTI, and TUM VI.
The source code is available at: https://github.com/AUBVRL/fslam_ros_docker.
- Abstract(参考訳): 近年のモノクロオドメトリーにおけるハイブリッド手法の成功は、ハイブリッドモノクロスラムの性能向上を一般化しようとする多くの試みにつながった。
しかし、ほとんどの試みはいくつかの点で不足しており、最も顕著な問題は、2つの異なる地図表現(ローカルマップとグローバルマップ)の必要性であり、それぞれが異なる、計算コストが高く、しばしば冗長なプロセスを必要とする。
さらに、これらの地図は互いにドリフトする傾向があり、ポーズやシーンの推定と矛盾する結果となり、壊滅的な失敗に繋がる。
本稿では,1つの逆深度シーン表現を生成するために記述子共有を利用する新しい手法を提案する。
この表現は局所的に使用することができ、ループクロージャを実行するためにグローバルにクエリされ、冗長なポイントがローカルマップから疎外された後に、以前に観測されたマップポイントを再活性化する機能を持ち、分離された冗長なマップ保守プロセスは不要である。
提案手法で生成したマップは互いにドリフトを示さず,他の単分子SLAMシステムに必要な計算コストとメモリフットプリントのごく一部で計算できる。
リソース要件の削減にもかかわらず、提案手法はその堅牢性と正確性を維持し、EuRoC、KITTI、TUM VIといった有名なデータセットからのほとんどのシーケンスに対して、最先端のSLAMメソッド(LDSO、ORB-SLAM3)に匹敵するパフォーマンスを提供する。
ソースコードは、https://github.com/AUBVRL/fslam_ros_docker.comで入手できる。
関連論文リスト
- TranSplat: Generalizable 3D Gaussian Splatting from Sparse Multi-View Images with Transformers [14.708092244093665]
我々は,正確な局所特徴マッチングを導くために,予測深度信頼マップを利用する戦略を開発する。
本稿では,RealEstate10KベンチマークとACIDベンチマークの両方で最高の性能を示すTranSplatという新しいG-3DGS手法を提案する。
論文 参考訳(メタデータ) (2024-08-25T08:37:57Z) - Splat-SLAM: Globally Optimized RGB-only SLAM with 3D Gaussians [87.48403838439391]
3D Splattingは、RGBのみの高密度SLAMの幾何学と外観の強力な表現として登場した。
本稿では,高密度な3次元ガウス写像表現を持つRGBのみのSLAMシステムを提案する。
Replica、TUM-RGBD、ScanNetのデータセットに対する実験は、グローバルに最適化された3Dガウスの有効性を示している。
論文 参考訳(メタデータ) (2024-05-26T12:26:54Z) - MGS-SLAM: Monocular Sparse Tracking and Gaussian Mapping with Depth Smooth Regularization [29.713650915551632]
本稿では,ガウススプラッティングに基づく濃密な視覚的局所化とマッピングのための新しいフレームワークを紹介する。
疎視度追跡と3次元ガウススプラッティングのシーン表現を初めて共同で最適化する。
ポーズ推定の精度は既存の手法や最先端の手法を超越している。
論文 参考訳(メタデータ) (2024-05-10T04:42:21Z) - Loopy-SLAM: Dense Neural SLAM with Loop Closures [53.11936461015725]
ポーズをグローバルに最適化するLoopy-SLAMと高密度3Dモデルを導入する。
我々は,データ駆動のポイントベースサブマップ生成手法を用いてフレーム・ツー・モデル追跡を行い,グローバルな位置認識を行うことで,オンラインのループクロージャをトリガーする。
合成Replicaおよび実世界のTUM-RGBDおよびScanNetデータセットの評価は、既存の高密度ニューラルネットワークRGBD SLAM法と比較して、追跡、マッピング、レンダリングの精度の競争力または優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-14T18:18:32Z) - Occ$^2$Net: Robust Image Matching Based on 3D Occupancy Estimation for
Occluded Regions [14.217367037250296]
Occ$2$Netは、3D占有率を用いて閉塞関係をモデル化し、閉塞領域の一致点を推測する画像マッチング手法である。
本手法は実世界とシミュレーションデータセットの両方で評価し,いくつかの指標における最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-14T13:09:41Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Unpaired Image Super-Resolution with Optimal Transport Maps [128.1189695209663]
実世界の画像超解像(SR)タスクは、しばしば、教師付き技術の適用を制限するペアデータセットを持っていない。
本稿では,非バイアスのOTマップを知覚輸送コストで学習する未ペアSRのアルゴリズムを提案する。
我々のアルゴリズムは、大規模無人AIM-19データセット上で、最先端のパフォーマンスをほぼ提供する。
論文 参考訳(メタデータ) (2022-02-02T16:21:20Z) - Visual SLAM with Graph-Cut Optimized Multi-Plane Reconstruction [11.215334675788952]
本稿では,インスタンス平面セグメンテーションネットワークからのキューを用いたポーズ推定とマッピングを改善する意味平面SLAMシステムを提案する。
メインストリームのアプローチはRGB-Dセンサーを使用するが、そのようなシステムを備えた単眼カメラを使うことは、ロバストデータアソシエーションや正確な幾何モデルフィッティングといった課題に直面している。
論文 参考訳(メタデータ) (2021-08-09T18:16:08Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。