論文の概要: Slice Transformer and Self-supervised Learning for 6DoF Localization in
3D Point Cloud Maps
- arxiv url: http://arxiv.org/abs/2301.08957v2
- Date: Sun, 13 Aug 2023 05:53:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 22:36:20.750048
- Title: Slice Transformer and Self-supervised Learning for 6DoF Localization in
3D Point Cloud Maps
- Title(参考訳): スライストランスフォーマーと自己教師付き学習による3dポイントクラウドマップにおける6dof位置推定
- Authors: Muhammad Ibrahim, Naveed Akhtar, Saeed Anwar, Michael Wise and Ajmal
Mian
- Abstract要約: 本稿では,360円のLiDARスキャンのスライスを再編成し,その軸方向特性を活かしたプレテキストタスクを提案する。
我々のモデルはSlice Transformerと呼ばれ、スライスを体系的に処理しながらマルチヘッドで処理する。
私たちの知る限りでは、これは屋外の点雲にマルチヘッドアテンションを利用する最初の例です。
- 参考スコア(独自算出の注目度): 64.14220803088223
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Precise localization is critical for autonomous vehicles. We present a
self-supervised learning method that employs Transformers for the first time
for the task of outdoor localization using LiDAR data. We propose a pre-text
task that reorganizes the slices of a $360^\circ$ LiDAR scan to leverage its
axial properties. Our model, called Slice Transformer, employs multi-head
attention while systematically processing the slices. To the best of our
knowledge, this is the first instance of leveraging multi-head attention for
outdoor point clouds. We additionally introduce the Perth-WA dataset, which
provides a large-scale LiDAR map of Perth city in Western Australia, covering
$\sim$4km$^2$ area. Localization annotations are provided for Perth-WA. The
proposed localization method is thoroughly evaluated on Perth-WA and
Appollo-SouthBay datasets. We also establish the efficacy of our
self-supervised learning approach for the common downstream task of object
classification using ModelNet40 and ScanNN datasets. The code and Perth-WA data
will be publicly released.
- Abstract(参考訳): 精密なローカライゼーションは自動運転車にとって重要である。
本稿では,LiDARデータを用いた屋外ローカライズ作業にトランスフォーマーを用いた自己教師型学習手法を提案する。
360^\circ$のlidarスキャンのスライスを再編成し、その軸方向の特性を活用するプリテキストタスクを提案する。
我々のモデルはSlice Transformerと呼ばれ、スライスを体系的に処理しながらマルチヘッドで処理する。
私たちの知る限りでは、これは屋外の点雲にマルチヘッドアテンションを利用する最初の例です。
さらに、オーストラリア西部のパース市の大規模LiDARマップを提供するPerth-WAデータセットを紹介し、$\sim$4km$^2$のエリアをカバーしている。
ローカライズアノテーションはPerth-WA向けに提供されている。
提案手法はPerth-WAとAppollo-SouthBayのデータセットで完全に評価される。
また、ModelNet40とScanNNデータセットを用いたオブジェクト分類の共通下流タスクに対する自己教師型学習手法の有効性を確立した。
コードとPerth-WAデータは公開されます。
関連論文リスト
- FDCNet: Feature Drift Compensation Network for Class-Incremental Weakly
Supervised Object Localization [10.08410402383604]
本研究は、クラス増分弱教師付きオブジェクトローカライゼーション(CI-WSOL)の課題に対処する。
ゴールは、画像レベルのアノテーションのみを使用して、新しいクラスのオブジェクトローカライゼーションを漸進的に学習し、以前に学習したクラスをローカライズする能力を維持することである。
まず、クラスインクリメンタル分類器の戦略を破滅的な忘れ方に適用し、CI-WSOLの強力なベースライン法を提案する。
そこで我々は,特徴ドリフトがクラススコアやローカライゼーションマップに与える影響を補償する特徴ドリフト補償ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-17T01:10:45Z) - Weakly Supervised Point Clouds Transformer for 3D Object Detection [4.723682216326063]
本稿では3次元物体検出に使用される点雲変圧器の弱監督のための枠組みを提案する。
目的は、3Dデータセットのアノテートに高いコストがかかるため、トレーニングに必要な監督の必要な量を削減することである。
挑戦的なKITTIデータセットでは、実験結果は平均精度が最も高いレベルに達した。
論文 参考訳(メタデータ) (2023-09-08T03:56:34Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - Language-Guided 3D Object Detection in Point Cloud for Autonomous
Driving [91.91552963872596]
我々は,LiDARグラウンディングと呼ばれるマルチモーダルな視覚的グラウンドニングタスクを提案する。
言語特徴を持つLiDARベースの物体検出器を共同で学習し、検出器から直接対象領域を予測する。
私たちの研究は、LiDARベースの接地作業に関する深い洞察を提供しており、自動運転コミュニティにとって有望な方向性を示すものと期待しています。
論文 参考訳(メタデータ) (2023-05-25T06:22:10Z) - Agent with Tangent-based Formulation and Anatomical Perception for
Standard Plane Localization in 3D Ultrasound [56.7645826576439]
3D USにおけるSP自動位置決めのための新しい強化学習フレームワークを提案する。
まず、RLにおける接点に基づく問題として、3D USにおけるSP局所化を定式化し、作用空間を再構成する。
第2に、平面探索における非SPとSPの交差する微妙な違いを認識するモデルの能力を高めるための補助的タスク学習戦略を設計する。
論文 参考訳(メタデータ) (2022-07-01T14:53:27Z) - Structure Aware and Class Balanced 3D Object Detection on nuScenes
Dataset [0.0]
NuTonomyのnuScenesデータセットは、KITTIのような一般的なデータセットを大きく拡張している。
このモデルの局所化精度は、ダウンスケールされた特徴写像における空間情報の損失に影響される。
本稿では,3次元点雲の構造情報をフル活用した補助ネットワークを設計することで,CBGSモデルの性能を向上させることを提案する。
論文 参考訳(メタデータ) (2022-05-25T06:18:49Z) - EdgeLoc: An Edge-IoT Framework for Robust Indoor Localization Using
Capsule Networks [3.659977669398194]
カプセルネットワークを用いた効率的で堅牢な屋内ローカライズのためのエッジIoTフレームワークであるEdgeLocを提案する。
WiFi指紋データから階層情報を効率的に抽出する深層学習モデルをCapsNetで開発する。
我々は,33,600点以上のデータポイントを用いて実世界のフィールド実験を行い,オープンデータセットを用いた広範囲な合成実験を行った。
論文 参考訳(メタデータ) (2020-09-12T12:38:47Z) - Searching Collaborative Agents for Multi-plane Localization in 3D
Ultrasound [59.97366727654676]
3D超音波(US)はその豊富な診断情報、可搬性、低コストのために広く用いられている。
米国における標準平面(SP)のローカライゼーションは,効率の向上とユーザ依存の低減だけでなく,米国における3D解釈の促進にも寄与する。
本稿では,複数の子宮SPを同時に3D USにローカライズするマルチエージェント強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-30T07:23:55Z) - Agent with Warm Start and Active Termination for Plane Localization in
3D Ultrasound [56.14006424500334]
超音波(US)診断には標準面の局在が不可欠である。
出生前のアメリカでは、何十もの標準的な飛行機が手動で2Dプローブで取得される。
胎児脳標準平面を3DUSで自動的に局所化するための新しい強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2019-10-10T02:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。