論文の概要: TransLoc3D : Point Cloud based Large-scale Place Recognition using
Adaptive Receptive Fields
- arxiv url: http://arxiv.org/abs/2105.11605v1
- Date: Tue, 25 May 2021 01:54:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-26 14:11:13.713494
- Title: TransLoc3D : Point Cloud based Large-scale Place Recognition using
Adaptive Receptive Fields
- Title(参考訳): TransLoc3D : 適応受容場を用いた点雲に基づく大規模位置認識
- Authors: Tian-Xing Xu, Yuan-Chen Guo, Yu-Kun Lai, Song-Hai Zhang
- Abstract要約: 固定受容場は位置認識には適していないと我々は主張する。
本稿では,入力点クラウドに基づいて受容場のサイズを適応的に調整できる新しい適応受容場モジュール(ARFM)を提案する。
また,新たなネットワークアーキテクチャであるTransLoc3Dを提案する。
- 参考スコア(独自算出の注目度): 40.55971834919629
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Place recognition plays an essential role in the field of autonomous driving
and robot navigation. Although a number of point cloud based methods have been
proposed and achieved promising results, few of them take the size difference
of objects into consideration. For small objects like pedestrians and vehicles,
large receptive fields will capture unrelated information, while small
receptive fields would fail to encode complete geometric information for large
objects such as buildings. We argue that fixed receptive fields are not well
suited for place recognition, and propose a novel Adaptive Receptive Field
Module (ARFM), which can adaptively adjust the size of the receptive field
based on the input point cloud. We also present a novel network architecture,
named TransLoc3D, to obtain discriminative global descriptors of point clouds
for the place recognition task. TransLoc3D consists of a 3D sparse
convolutional module, an ARFM module, an external transformer network which
aims to capture long range dependency and a NetVLAD layer. Experiments show
that our method outperforms prior state-of-the-art results, with an improvement
of 1.1\% on average recall@1 on the Oxford RobotCar dataset, and 0.8\% on the
B.D. dataset.
- Abstract(参考訳): 位置認識は、自動運転とロボットナビゲーションの分野で重要な役割を担っている。
多くのポイントクラウドベースの手法が提案され、有望な結果を得たが、オブジェクトのサイズの違いを考慮しているものはほとんどない。
歩行者や車両のような小さな物体の場合、大きな受容野は無関係な情報を取り込み、小さな受容野は建物のような大きな物体の完全な幾何学的情報をエンコードすることができない。
固定受容場は位置認識には適さないと主張し,入力点クラウドに基づいて受容場のサイズを適応的に調整できる新しい適応受容場モジュール (ARFM) を提案する。
また、位置認識タスクのための点雲の識別的グローバル記述子を得るために、TransLoc3Dという新しいネットワークアーキテクチャを提案する。
TransLoc3Dは、3Dスパース畳み込みモジュール、ARFMモジュール、長距離依存性のキャプチャを目的とした外部トランスフォーマーネットワーク、NetVLADレイヤで構成されている。
実験の結果,オックスフォード・ロボカル・データセットの平均リコール@1では1.1 %,B.D.では0.8 %の改善が得られた。
データセット。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - FASTC: A Fast Attentional Framework for Semantic Traversability Classification Using Point Cloud [7.711666704468952]
点雲を用いたトラバーサビリティ評価の問題に対処する。
本稿では,垂直に配置された点雲から特徴を捉えるために PointNet を利用した柱状特徴抽出モジュールを提案する。
次に、LIDAR点雲の密度問題に適切に対応できる多フレーム情報を融合する新しい時間的アテンションモジュールを提案する。
論文 参考訳(メタデータ) (2024-06-24T12:01:55Z) - Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。
本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。
我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文 参考訳(メタデータ) (2024-03-20T12:51:30Z) - HEDNet: A Hierarchical Encoder-Decoder Network for 3D Object Detection
in Point Clouds [19.1921315424192]
ポイントクラウドにおける3Dオブジェクト検出は、自律運転システムにとって重要である。
3Dオブジェクト検出における主な課題は、3Dシーン内の点のスパース分布に起因する。
本稿では3次元オブジェクト検出のための階層型エンコーダデコーダネットワークであるHEDNetを提案する。
論文 参考訳(メタデータ) (2023-10-31T07:32:08Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - Transformers for Object Detection in Large Point Clouds [9.287964414592826]
トランスLPC(TransLPC)は,変圧器アーキテクチャに基づく大点雲の新しい検出モデルである。
本稿では,メモリフレンドリーな変圧器デコーダクエリ数を維持しながら,検出精度を向上させる新しいクエリ改善手法を提案する。
この単純な手法は検出精度に大きな影響を与え、実際のライダーデータ上での挑戦的なnuScenesデータセットで評価される。
論文 参考訳(メタデータ) (2022-09-30T06:35:43Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - M3DeTR: Multi-representation, Multi-scale, Mutual-relation 3D Object
Detection with Transformers [78.48081972698888]
M3DeTRは、マルチスケールのフィーチャーピラミッドに基づいて、異なるポイントクラウド表現と異なる機能スケールを組み合わせたものです。
M3DeTRは、複数のポイントクラウド表現、機能スケール、およびトランスを使用してポイントクラウド間の相互関係を同時にモデル化する最初のアプローチです。
論文 参考訳(メタデータ) (2021-04-24T06:48:23Z) - Stereo RGB and Deeper LIDAR Based Network for 3D Object Detection [40.34710686994996]
3Dオブジェクト検出は、自動運転のシナリオにおいて新たな課題となっている。
以前の作業では、プロジェクションベースまたはボクセルベースのモデルを使用して3Dポイントクラウドを処理していた。
本稿では,意味情報と空間情報の同時利用が可能なStereo RGBおよびDeeper LIDARフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-09T11:19:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。