論文の概要: ManhattanSLAM: Robust Planar Tracking and Mapping Leveraging Mixture of
Manhattan Frames
- arxiv url: http://arxiv.org/abs/2103.15068v1
- Date: Sun, 28 Mar 2021 07:11:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-30 14:40:12.948873
- Title: ManhattanSLAM: Robust Planar Tracking and Mapping Leveraging Mixture of
Manhattan Frames
- Title(参考訳): manhattanslam: マンハッタンフレームの混合を利用したロバストな平面追跡とマッピング
- Authors: Raza Yunus, Yanyan Li and Federico Tombari
- Abstract要約: RGB-D SLAM システムは屋内のシーンにおける構造情報を活用するために提案され、CPU上での正確な追跡と効率的な高密度マッピングを可能にする。
平面波は地図上のスパース平面から直接発生し,非平面波はスーパーピクセルを抽出して生成する。
提案手法は,ポーズ推定,ドリフト,再構成の精度を,他の最先端手法と比較して高い性能で評価する。
- 参考スコア(独自算出の注目度): 41.33367060137042
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, a robust RGB-D SLAM system is proposed to utilize the
structural information in indoor scenes, allowing for accurate tracking and
efficient dense mapping on a CPU. Prior works have used the Manhattan World
(MW) assumption to estimate low-drift camera pose, in turn limiting the
applications of such systems. This paper, in contrast, proposes a novel
approach delivering robust tracking in MW and non-MW environments. We check
orthogonal relations between planes to directly detect Manhattan Frames,
modeling the scene as a Mixture of Manhattan Frames. For MW scenes, we decouple
pose estimation and provide a novel drift-free rotation estimation based on
Manhattan Frame observations. For translation estimation in MW scenes and full
camera pose estimation in non-MW scenes, we make use of point, line and plane
features for robust tracking in challenging scenes. %mapping Additionally, by
exploiting plane features detected in each frame, we also propose an efficient
surfel-based dense mapping strategy, which divides each image into planar and
non-planar regions. Planar surfels are initialized directly from sparse planes
in our map while non-planar surfels are built by extracting superpixels. We
evaluate our method on public benchmarks for pose estimation, drift and
reconstruction accuracy, achieving superior performance compared to other
state-of-the-art methods. We will open-source our code in the future.
- Abstract(参考訳): 本稿では,RGB-D SLAMシステムを提案し,室内環境における構造情報を活用することにより,CPU上での正確な追跡と効率的な高密度マッピングを実現する。
以前の作品では、マンハッタン世界 (mw) の仮定を用いて低ドリフトカメラのポーズを推定し、そのようなシステムの応用を制限している。
一方,本稿では,MW環境と非MW環境におけるロバストなトラッキングを実現する新しい手法を提案する。
平面間の直交関係をチェックし、マンハッタンのフレームを直接検出し、シーンをマンハッタンのフレームの混合としてモデル化する。
MWシーンでは、ポーズ推定を分離し、マンハッタンフレーム観測に基づく新しいドリフトフリー回転推定を提供する。
MWシーンの翻訳推定や非MWシーンのフルカメラポーズ推定では,難易度の高いシーンにおいて,ポイント,ライン,平面の特徴を利用してロバストなトラッキングを行う。
さらに,各フレームで検出された平面特徴を活用し,各画像を平面領域と非平面領域に分割した,効率的なサーフェルに基づく高密度マッピング戦略を提案する。
平面波は地図上のスパース平面から直接初期化され、非平面波はスーパーピクセルを抽出することによって構築される。
提案手法は,ポーズ推定,ドリフト,再構成の精度を,他の最先端手法と比較して高い性能で評価する。
将来的にはコードをオープンソースにします。
関連論文リスト
- Plane2Depth: Hierarchical Adaptive Plane Guidance for Monocular Depth Estimation [38.81275292687583]
平面情報を適応的に利用し,階層的なフレームワーク内での深度予測を改善するPlane2Depthを提案する。
提案する平面案内深度発生器 (PGDG) では, 現場の平面をソフトにモデル化し, 画素ごとの平面係数を予測するためのプロトタイプとして, 一連の平面クエリを設計する。
提案するアダプティブプレーンクエリアグリゲーション(APGA)モジュールでは,マルチスケール平面特徴のアグリゲーションを改善するために,新たな機能インタラクションアプローチを導入する。
論文 参考訳(メタデータ) (2024-09-04T07:45:06Z) - Q-SLAM: Quadric Representations for Monocular SLAM [85.82697759049388]
四角形のレンズを通して体積表現を再現する。
我々は、RGB入力からノイズの深い深さ推定を正すために二次仮定を用いる。
本研究では,新たな二次分割変換器を導入し,二次情報を集約する。
論文 参考訳(メタデータ) (2024-03-12T23:27:30Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - Stable Yaw Estimation of Boats from the Viewpoint of UAVs and USVs [14.573513188682183]
6次元空間におけるボートの向きを予測するためのHyperPosePDFに基づく手法を提案する。
われわれはHyperPosePDFをビデオベースのシナリオに拡張し、時間をかけて堅牢な方向予測を行う。
論文 参考訳(メタデータ) (2023-06-24T20:47:37Z) - P$^2$SDF for Neural Indoor Scene Reconstruction [29.355255923026597]
そこで本研究では,屋内シーン再構築のためのPseudo Plane-regularized Signed Distance Field (P$2$SDF)を提案する。
P$2$SDFはマンハッタンのシーンで競争力のある再現性能を発揮することを示す実験である。
論文 参考訳(メタデータ) (2023-03-01T05:07:48Z) - Ground Plane Matters: Picking Up Ground Plane Prior in Monocular 3D
Object Detection [92.75961303269548]
先行する地平面は、モノクル3次元物体検出(M3OD)における非常に情報的な幾何学的手がかりである
本稿では,両問題を一度に解決するGPENetを提案する。
我々のGPENetは、他の手法よりも優れ、最先端のパフォーマンスを実現し、提案手法の有効性と優位性を示すことができる。
論文 参考訳(メタデータ) (2022-11-03T02:21:35Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - PlaneSegNet: Fast and Robust Plane Estimation Using a Single-stage
Instance Segmentation CNN [12.251947429149796]
本稿では,単一のrgb画像から分割平面領域を推定する,リアルタイム深層ニューラルネットワークアーキテクチャを提案する。
本手法は2段階法に比べてフレームレートが著しく高く,セグメンテーション精度も同等である。
論文 参考訳(メタデータ) (2021-03-29T08:53:05Z) - Plane Pair Matching for Efficient 3D View Registration [7.920114031312631]
室内シーンにおける重なり合う3次元ビュー間の動き行列を推定する新しい手法を提案する。
マンハッタンの世界仮定を用いて、平面の四角形の下での軽量な幾何学的制約を問題に導入する。
我々は,玩具の例にアプローチを検証し,最近の最先端手法と比較し,公開RGB-Dデータセットの定量的実験を行った。
論文 参考訳(メタデータ) (2020-01-20T11:15:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。