論文の概要: Representing 3D sparse map points and lines for camera relocalization
- arxiv url: http://arxiv.org/abs/2402.18011v1
- Date: Wed, 28 Feb 2024 03:07:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 16:36:30.234339
- Title: Representing 3D sparse map points and lines for camera relocalization
- Title(参考訳): カメラ再局在化のための3次元スパースマップポイントと線表現
- Authors: Bach-Thuan Bui, Huy-Hoang Bui, Dinh-Tuan Tran, and Joo-Ho Lee
- Abstract要約: 軽量ニューラルネットワークが3Dポイントとラインの両方の特徴を表現するためにどのように学習できるかを示す。
テストにおいて,本手法は,最先端の学習手法に対する最も顕著な向上を図っている。
- 参考スコア(独自算出の注目度): 1.2974519529978974
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in visual localization and mapping have demonstrated
considerable success in integrating point and line features. However, expanding
the localization framework to include additional mapping components frequently
results in increased demand for memory and computational resources dedicated to
matching tasks. In this study, we show how a lightweight neural network can
learn to represent both 3D point and line features, and exhibit leading pose
accuracy by harnessing the power of multiple learned mappings. Specifically, we
utilize a single transformer block to encode line features, effectively
transforming them into distinctive point-like descriptors. Subsequently, we
treat these point and line descriptor sets as distinct yet interconnected
feature sets. Through the integration of self- and cross-attention within
several graph layers, our method effectively refines each feature before
regressing 3D maps using two simple MLPs. In comprehensive experiments, our
indoor localization findings surpass those of Hloc and Limap across both
point-based and line-assisted configurations. Moreover, in outdoor scenarios,
our method secures a significant lead, marking the most considerable
enhancement over state-of-the-art learning-based methodologies. The source code
and demo videos of this work are publicly available at:
https://thpjp.github.io/pl2map/
- Abstract(参考訳): 近年の視覚的ローカライゼーションとマッピングの進歩は、点と線の特徴の統合において大きな成功を収めている。
しかし、ローカライゼーションフレームワークを拡張して追加のマッピングコンポーネントを含めると、しばしばタスクのマッチングに特化したメモリと計算リソースの需要が増加する。
本研究では,軽量ニューラルネットワークを用いて3次元点と線の特徴を表現し,複数の学習マップのパワーを活用し,先導的なポーズ精度を示す方法を示す。
具体的には,1つの変圧器ブロックを用いて線特徴を符号化し,それらを特異点のような記述子に変換する。
その後、これらの点と行記述子集合を別々に相互接続された特徴集合として扱う。
複数のグラフ層における自己およびクロスアテンションの統合により,2つの単純なmlpを用いて3dマップをレグレッションする前に,各機能を効果的に洗練する。
総合的な実験では, 室内の局所化は, Hloc と Limap を, 点ベース, ラインアシストの両構成で上回った。
さらに,屋外シナリオにおいて,本手法は最先端の学習手法に対する最も顕著な強化を図り,重要なリードを確保できる。
この作業のソースコードとデモビデオは、https://thpjp.github.io/pl2map/で公開されている。
関連論文リスト
- ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - LISNeRF Mapping: LiDAR-based Implicit Mapping via Semantic Neural Fields for Large-Scale 3D Scenes [2.822816116516042]
大規模セマンティックマッピングは、屋外の自律エージェントが計画やナビゲーションといった高度なタスクを遂行するために不可欠である。
本稿では,提案するLiDAR測度のみでの暗黙的表現による大規模3次元意味再構築手法を提案する。
論文 参考訳(メタデータ) (2023-11-04T03:55:38Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - 3D Line Mapping Revisited [86.13455066577657]
LIMAPは、3Dラインマッピングのためのライブラリで、多視点画像から3Dラインマップを堅牢かつ効率的に作成する。
私たちのコードは、既存のポイントベースのStructure-from-Motionメソッドとシームレスに統合されます。
私たちの堅牢な3Dラインマップは、新たな研究方向も開きます。
論文 参考訳(メタデータ) (2023-03-30T16:14:48Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Improving Lidar-Based Semantic Segmentation of Top-View Grid Maps by
Learning Features in Complementary Representations [3.0413873719021995]
我々は、自律運転の文脈において、スパースで単発のLiDAR測定から意味情報を予測するための新しい方法を提案する。
このアプローチは、トップビューグリッドマップのセマンティックセグメンテーションを改善することを目的としている。
各表現に対して、セマンティック情報を効果的に抽出するために、調整されたディープラーニングアーキテクチャが開発された。
論文 参考訳(メタデータ) (2022-03-02T14:49:51Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - Towards Reading Beyond Faces for Sparsity-Aware 4D Affect Recognition [55.15661254072032]
自動4次元表情認識(FER)のための空間認識深層ネットワークを提案する。
まず,深層学習のためのデータ制限問題に対処する新しい拡張手法を提案する。
次に、多視点での畳み込み特徴のスパース表現を計算するために、疎度対応のディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-08T13:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。