論文の概要: NDT-Transformer: Large-Scale 3D Point Cloud Localisation using the
Normal Distribution Transform Representation
- arxiv url: http://arxiv.org/abs/2103.12292v1
- Date: Tue, 23 Mar 2021 04:04:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 02:25:58.353834
- Title: NDT-Transformer: Large-Scale 3D Point Cloud Localisation using the
Normal Distribution Transform Representation
- Title(参考訳): ndt-transformer:正規分布変換表現を用いた大規模3dポイントクラウドローカライズ
- Authors: Zhicheng Zhou, Cheng Zhao, Daniel Adolfsson, Songzhi Su, Yang Gao, and
Tom Duckett, Li Sun
- Abstract要約: GPS対応環境での自動運転により、3Dポイントクラウドによる位置認識が求められています。
本稿では,3次元点雲を用いたリアルタイム・大規模位置認識のための新しい手法 NDT-Transformer を提案する。
- 参考スコア(独自算出の注目度): 16.227913384694347
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D point cloud-based place recognition is highly demanded by autonomous
driving in GPS-challenged environments and serves as an essential component
(i.e. loop-closure detection) in lidar-based SLAM systems. This paper proposes
a novel approach, named NDT-Transformer, for realtime and large-scale place
recognition using 3D point clouds. Specifically, a 3D Normal Distribution
Transform (NDT) representation is employed to condense the raw, dense 3D point
cloud as probabilistic distributions (NDT cells) to provide the geometrical
shape description. Then a novel NDT-Transformer network learns a global
descriptor from a set of 3D NDT cell representations. Benefiting from the NDT
representation and NDT-Transformer network, the learned global descriptors are
enriched with both geometrical and contextual information. Finally, descriptor
retrieval is achieved using a query-database for place recognition. Compared to
the state-of-the-art methods, the proposed approach achieves an improvement of
7.52% on average top 1 recall and 2.73% on average top 1% recall on the Oxford
Robotcar benchmark.
- Abstract(参考訳): 3Dポイントのクラウドベースの位置認識は、GPSで照らされた環境での自律運転によって非常に要求され、必須のコンポーネント(つまり)として機能する。
lidarベースのslamシステムにおけるループクロージャ検出)
本稿では,3次元点雲を用いたリアルタイム・大規模位置認識のための新しい手法 NDT-Transformer を提案する。
具体的には、3D正規分布変換(NDT)表現を用いて、生で密度の高い3D点雲を確率分布(NDTセル)として凝縮させ、幾何学的形状記述を提供する。
そして、新しいNDT-Transformerネットワークは、3次元NDTセル表現の集合からグローバルディスクリプタを学習する。
NDT表現とNDT-Transformerネットワークの利点により、学習したグローバルディスクリプタは幾何学的情報と文脈的情報の両方に富んでいる。
最後に、位置認識のためのクエリデータベースを用いて記述子検索を行う。
最先端の手法と比較して、提案手法は平均トップ1リコールで7.52%、オックスフォード・ロボカーベンチマークで平均トップ1%リコールで2.73%の改善を達成している。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - UniTR: A Unified and Efficient Multi-Modal Transformer for
Bird's-Eye-View Representation [113.35352122662752]
屋外3次元知覚のためのマルチモーダルバックボーンUniTRを提案する。
UniTRは、統一されたモデリングと共有パラメータで様々なモダリティを処理する。
UniTRは基本的にタスクに依存しないバックボーンであり、異なる3D知覚タスクを自然にサポートする。
論文 参考訳(メタデータ) (2023-08-15T12:13:44Z) - Dynamic Clustering Transformer Network for Point Cloud Segmentation [23.149220817575195]
動的クラスタリングトランスネットワーク(DCTNet)と呼ばれる新しい3Dポイントクラウド表現ネットワークを提案する。
エンコーダ-デコーダアーキテクチャがあり、ローカルとグローバルの両方の機能学習が可能である。
提案手法は,オブジェクトベースデータセット(ShapeNet),都市ナビゲーションデータセット(Toronto-3D),マルチスペクトルLiDARデータセットを用いて評価した。
論文 参考訳(メタデータ) (2023-05-30T01:11:05Z) - PVT-SSD: Single-Stage 3D Object Detector with Point-Voxel Transformer [75.2251801053839]
単段3次元検出用ポイント・ボクセル変換器(PVT-SSD)を提案する。
本稿では,voxel から長時間のコンテキストを安価に取得できる Point-Voxel Transformer (PVT) モジュールを提案する。
いくつかの自律走行ベンチマーク実験は,提案手法の有効性と有効性を検証する。
論文 参考訳(メタデータ) (2023-05-11T07:37:15Z) - Spherical Transformer: Adapting Spherical Signal to CNNs [53.18482213611481]
Spherical Transformerは、球状信号を標準CNNで直接処理できるベクトルに変換できます。
我々は,球面MNIST認識,3次元オブジェクト分類,全方向画像セマンティックセグメンテーションの課題に対するアプローチを評価する。
論文 参考訳(メタデータ) (2021-01-11T12:33:16Z) - SpinNet: Learning a General Surface Descriptor for 3D Point Cloud
Registration [57.28608414782315]
ローカルな特徴を抽出するために、SpinNetと呼ばれる新しい、概念的にはシンプルで、ニューラルなアーキテクチャを導入する。
屋内と屋外の両方の実験では、SpinNetが既存の最先端技術より優れていることが示されている。
論文 参考訳(メタデータ) (2020-11-24T15:00:56Z) - Rotation-Invariant Local-to-Global Representation Learning for 3D Point
Cloud [42.86112554931754]
本稿では,3次元点クラウドデータに対する局所的-言語的表現学習アルゴリズムを提案する。
本モデルは,グラフ畳み込みニューラルネットワークに基づく多レベル抽象化を利用する。
提案アルゴリズムは,3次元物体の回転認識とセグメント化のベンチマークにおいて,最先端の性能を示す。
論文 参考訳(メタデータ) (2020-10-07T10:30:20Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - Augmenting Visual Place Recognition with Structural Cues [46.89180519082908]
画像に基づく位置認識を構造的手がかりで強化することを提案する。
これは、画像ベースの位置認識に一般的に使用される2D畳み込みニューラルネットワーク(CNN)を3D CNNで拡張することで実現される。
Oxford RobotCarデータセットでは、入力モードの1つだけから抽出したディスクリプタと比較して、結果のディスクリプタは優れた認識性能を示す。
論文 参考訳(メタデータ) (2020-02-29T15:28:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。