論文の概要: LaserMix for Semi-Supervised LiDAR Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2207.00026v4
- Date: Fri, 1 Sep 2023 09:58:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-04 17:41:49.096372
- Title: LaserMix for Semi-Supervised LiDAR Semantic Segmentation
- Title(参考訳): 半教師付きlidarセマンティクスセグメンテーションのためのlasermix
- Authors: Lingdong Kong and Jiawei Ren and Liang Pan and Ziwei Liu
- Abstract要約: We study the underexplored semi-supervised learning (SSL) in LiDAR segmentation。
当社の中核となる考え方は、LiDAR点雲の強い空間的手がかりを活用して、ラベルのないデータをうまく活用することです。
我々は、異なるLiDARスキャンからレーザービームを混合し、一貫性と自信のある予測を行うことを奨励するLaserMixを提案する。
- 参考スコア(独自算出の注目度): 56.73779694312137
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Densely annotating LiDAR point clouds is costly, which restrains the
scalability of fully-supervised learning methods. In this work, we study the
underexplored semi-supervised learning (SSL) in LiDAR segmentation. Our core
idea is to leverage the strong spatial cues of LiDAR point clouds to better
exploit unlabeled data. We propose LaserMix to mix laser beams from different
LiDAR scans, and then encourage the model to make consistent and confident
predictions before and after mixing. Our framework has three appealing
properties: 1) Generic: LaserMix is agnostic to LiDAR representations (e.g.,
range view and voxel), and hence our SSL framework can be universally applied.
2) Statistically grounded: We provide a detailed analysis to theoretically
explain the applicability of the proposed framework. 3) Effective:
Comprehensive experimental analysis on popular LiDAR segmentation datasets
(nuScenes, SemanticKITTI, and ScribbleKITTI) demonstrates our effectiveness and
superiority. Notably, we achieve competitive results over fully-supervised
counterparts with 2x to 5x fewer labels and improve the supervised-only
baseline significantly by 10.8% on average. We hope this concise yet
high-performing framework could facilitate future research in semi-supervised
LiDAR segmentation. Code is publicly available.
- Abstract(参考訳): 厳密な注釈付きLiDARポイントクラウドはコストがかかり、完全に教師付き学習手法のスケーラビリティを抑える。
本研究では,LiDARセグメンテーションにおける未探索半教師付き学習(SSL)について検討する。
当社の中核となる考え方は、LiDAR点雲の強い空間的手がかりを活用して、ラベルのないデータをうまく活用することだ。
我々は、異なるLiDARスキャンからレーザービームを混合し、混合前後に一貫した確実な予測を行うことを推奨するLaserMixを提案する。
私たちのフレームワークには3つの魅力があります。
1)ジェネリック: LaserMixはLiDAR表現(例えば、レンジビューとボクセル)に依存しないので、SSLフレームワークを普遍的に適用できます。
2) 統計的根拠: 提案手法の適用性を理論的に説明するための詳細な分析を行う。
3) 有効性: 一般的なLiDARセグメンテーションデータセット(nuScenes, SemanticKITTI, ScribbleKITTI)の総合的な実験分析により, 有効性と優位性を示す。
特に、2倍から5倍のラベルを持つ完全教師付きラベルよりも競争力があり、教師のみのベースラインを平均で10.8%向上させる。
この簡潔かつ高性能なフレームワークが,半教師付きLiDARセグメンテーションの今後の研究を促進することを願っている。
コードは公開されている。
関連論文リスト
- Multi-Modal Data-Efficient 3D Scene Understanding for Autonomous Driving [58.16024314532443]
我々は、異なるLiDARスキャンからレーザービーム操作を統合するフレームワークであるLaserMix++を導入し、データ効率の学習を支援するためにLiDAR-カメラ対応を組み込んだ。
結果は、LaserMix++が完全に教師付き代替よりも優れており、5倍のアノテーションで同等の精度を実現していることを示している。
この大幅な進歩は、LiDARベースの3Dシーン理解システムにおける広範囲なラベル付きデータへの依存を減らすための半教師付きアプローチの可能性を示している。
論文 参考訳(メタデータ) (2024-05-08T17:59:53Z) - Just Add $100 More: Augmenting NeRF-based Pseudo-LiDAR Point Cloud for Resolving Class-imbalance Problem [12.26293873825084]
本稿では,小クラスのミニチュアや現実世界のオブジェクトのサラウンドビューをキャプチャしたビデオから生成された擬似LiDAR点雲を活用することを提案する。
Pseudo Ground Truth Aug (PGT-Aug) と呼ばれるこの手法は, (i) 2D-to-3Dビュー合成モデルを用いたボリューム3Dインスタンス再構成, (ii)LiDAR強度推定によるオブジェクトレベルドメインアライメント, (iii) 地上情報と地図情報からのコンテキスト認識配置のハイブリッド化という3つのステップから構成される。
論文 参考訳(メタデータ) (2024-03-18T08:50:04Z) - UltraLiDAR: Learning Compact Representations for LiDAR Completion and
Generation [51.443788294845845]
我々は、シーンレベルのLiDAR補完、LiDAR生成、LiDAR操作のためのデータ駆動フレームワークであるUltraLiDARを提案する。
スパース点雲の表現を高密度点雲の表現に合わせることで、スパース点雲を密度化できることが示される。
個別のコードブック上で事前学習を行うことで、多種多様な現実的なLiDARポイントクラウドを自動走行のために生成できます。
論文 参考訳(メタデータ) (2023-11-02T17:57:03Z) - Point-to-Voxel Knowledge Distillation for LiDAR Semantic Segmentation [74.67594286008317]
本稿では,大きな教師モデルから,LiDARセマンティックセグメンテーションのためのスリムな学生ネットワークへの知識の抽出の問題に対処する。
本稿では,点レベルとボクセルレベルの両方から隠れた知識を伝達するPVDを提案する。
論文 参考訳(メタデータ) (2022-06-05T05:28:32Z) - LiDAR Distillation: Bridging the Beam-Induced Domain Gap for 3D Object
Detection [96.63947479020631]
多くの現実世界の応用において、大量生産されたロボットや車両が使用するLiDARポイントは通常、大規模な公開データセットよりもビームが少ない。
異なるLiDARビームによって誘導される領域ギャップをブリッジして3次元物体検出を行うLiDAR蒸留法を提案する。
論文 参考訳(メタデータ) (2022-03-28T17:59:02Z) - End-To-End Optimization of LiDAR Beam Configuration for 3D Object
Detection and Localization [87.56144220508587]
与えられたアプリケーションに対するLiDARビーム構成の最適化を学ぶために、新しい経路を取る。
ビーム構成を自動的に最適化する強化学習に基づく学習最適化フレームワークを提案する。
本手法は低解像度(低コスト)のLiDARが必要な場合に特に有用である。
論文 参考訳(メタデータ) (2022-01-11T09:46:31Z) - Scan-based Semantic Segmentation of LiDAR Point Clouds: An Experimental
Study [2.6205925938720833]
最先端の手法では、深いニューラルネットワークを使用して、LiDARスキャンの各点のセマンティッククラスを予測する。
LiDAR測定を処理するための強力で効率的な方法は、2次元の画像のような投影を使うことである。
メモリの制約だけでなく、パフォーマンスの向上やランタイムの改善など、さまざまなテクニックを実証する。
論文 参考訳(メタデータ) (2020-04-06T11:08:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。