論文の概要: PSA-SSL: Pose and Size-aware Self-Supervised Learning on LiDAR Point Clouds
- arxiv url: http://arxiv.org/abs/2503.13914v1
- Date: Tue, 18 Mar 2025 05:17:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-19 14:16:08.380235
- Title: PSA-SSL: Pose and Size-aware Self-Supervised Learning on LiDAR Point Clouds
- Title(参考訳): PSA-SSL:LiDARポイントクラウド上でのポースとサイズ対応の自己教師付き学習
- Authors: Barza Nisar, Steven L. Waslander,
- Abstract要約: PSA-SSLは,オブジェクトのポーズやサイズを認識した特徴を学習するクラウドSSLの新たな拡張である。
提案手法は,3次元セマンティックセグメンテーションと3次元オブジェクト検出において,最先端のSSL手法よりも優れている。
- 参考スコア(独自算出の注目度): 8.645078288584305
- License:
- Abstract: Self-supervised learning (SSL) on 3D point clouds has the potential to learn feature representations that can transfer to diverse sensors and multiple downstream perception tasks. However, recent SSL approaches fail to define pretext tasks that retain geometric information such as object pose and scale, which can be detrimental to the performance of downstream localization and geometry-sensitive 3D scene understanding tasks, such as 3D semantic segmentation and 3D object detection. We propose PSA-SSL, a novel extension to point cloud SSL that learns object pose and size-aware (PSA) features. Our approach defines a self-supervised bounding box regression pretext task, which retains object pose and size information. Furthermore, we incorporate LiDAR beam pattern augmentation on input point clouds, which encourages learning sensor-agnostic features. Our experiments demonstrate that with a single pretrained model, our light-weight yet effective extensions achieve significant improvements on 3D semantic segmentation with limited labels across popular autonomous driving datasets (Waymo, nuScenes, SemanticKITTI). Moreover, our approach outperforms other state-of-the-art SSL methods on 3D semantic segmentation (using up to 10 times less labels), as well as on 3D object detection. Our code will be released on https://github.com/TRAILab/PSA-SSL.
- Abstract(参考訳): 3Dポイントクラウド上の自己教師付き学習(SSL)は、多様なセンサーや複数の下流認識タスクに転送可能な特徴表現を学習する可能性がある。
しかし、最近のSSLアプローチでは、3Dセマンティックセグメンテーションや3Dオブジェクト検出といった、下流のローカライゼーションや幾何学に敏感な3Dシーン理解タスクのパフォーマンスに有害な、オブジェクトのポーズやスケールなどの幾何学的情報を保持するプリテキストタスクを定義することができない。
PSA-SSLはオブジェクトのポーズとサイズ認識機能(PSA)を学習するクラウドSSLの新たな拡張である。
提案手法では,オブジェクトのポーズやサイズ情報を保持する自己教師付き境界ボックス回帰テキストタスクを定義している。
さらに,入力点雲にLiDARビームパターンを付加し,センサに依存しない特徴の学習を促進する。
我々の実験は、単一の事前訓練モデルにより、私たちの軽量で効果的な拡張が、一般的な自動運転データセット(Waymo、nuScenes、SemanticKITTI)に限定されたラベルによる3Dセマンティックセマンティックセマンティックセマンティクスの大幅な改善を実現することを示した。
さらに,提案手法は,3Dセマンティックセグメンテーション(ラベルの最大10倍少ない)や3Dオブジェクト検出において,最先端のSSLメソッドよりも優れている。
私たちのコードはhttps://github.com/TRAILab/PSA-SSLでリリースされます。
関連論文リスト
- De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - MAELi: Masked Autoencoder for Large-Scale LiDAR Point Clouds [13.426810473131642]
Masked AutoEncoder for LiDAR Point clouds (MAELi) は、復元中にエンコーダとデコーダの両方でLiDARポイントクラウドの空間性を直感的に活用する。
新たな再構築アプローチでは、MAELiは空空間と隠された空間を区別する。
これにより、MAELiは基礎となる3次元シーンの幾何学と意味論の理解を得る。
論文 参考訳(メタデータ) (2022-12-14T13:10:27Z) - UpCycling: Semi-supervised 3D Object Detection without Sharing Raw-level
Unlabeled Scenes [7.32610370107512]
UpCyclingは、3Dオブジェクト検出のための新しいSSLフレームワークである。
F-GT(F-GT)と回転(F-RoT)のハイブリッド擬似ラベルを導入する。
UpCyclingは、生のポイントシーンを利用する最先端のSSLメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-11-22T02:04:09Z) - SL3D: Self-supervised-Self-labeled 3D Recognition [89.19932178712065]
自己教師付き自己ラベル型3D認識(SL3D)フレームワークを提案する。
SL3Dはクラスタリングと学習機能表現という2つの結合した目的を同時に解決する。
分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな3D認識タスクに応用することができる。
論文 参考訳(メタデータ) (2022-10-30T11:08:25Z) - Prompt-guided Scene Generation for 3D Zero-Shot Learning [8.658191774247944]
本稿では,ネットワークをよりよく学習するための3Dデータを増やすために,プロンプト誘導型3Dシーン生成と監視手法を提案する。
まず、2つの3Dモデルの点雲を、プロンプトによって記述された特定の方法でマージする。
我々は、合成(ModelNet40, ModelNet10)および実走査(ScanOjbectNN)3Dオブジェクトデータセット上で、最先端のZSLと一般化されたZSL性能を実現した。
論文 参考訳(メタデータ) (2022-09-29T11:24:33Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Zero-Shot Learning on 3D Point Cloud Objects and Beyond [21.6491982908705]
課題のいくつかを特定し,既存のモデルの性能を解析するために3次元領域に2次元ゼロショット学習(ZSL)手法を適用した。
観測された意味論とポイントクラウド機能を同時に調整する新しい損失関数を開発した。
幅広い実験が行われ、合成データセットと実データセットにZSLとGZSLの最先端を確立します。
論文 参考訳(メタデータ) (2021-04-11T10:04:06Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。