論文の概要: COLA: COarse LAbel pre-training for 3D semantic segmentation of sparse
LiDAR datasets
- arxiv url: http://arxiv.org/abs/2202.06884v3
- Date: Tue, 21 Mar 2023 07:12:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 05:14:54.391611
- Title: COLA: COarse LAbel pre-training for 3D semantic segmentation of sparse
LiDAR datasets
- Title(参考訳): cola: 疎lidarデータセットの3次元意味セグメンテーションのための粗いラベル事前学習
- Authors: Jules Sanchez, Jean-Emmanuel Deschaud and Fran\c{c}ois Goulette
- Abstract要約: 転送学習は、2次元コンピュータビジョンにおいて、利用可能な大量のデータを活用し、高い性能を達成するための実証された技術である。
本研究では,スパース自動運転LiDARスキャンのリアルタイムな3次元セマンティックセマンティックセマンティックセグメンテーションを実現する。
我々は,COLA(Coarse label pre-training)と呼ばれる新しい事前訓練タスクを導入する。
- 参考スコア(独自算出の注目度): 3.8243923744440926
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transfer learning is a proven technique in 2D computer vision to leverage the
large amount of data available and achieve high performance with datasets
limited in size due to the cost of acquisition or annotation. In 3D, annotation
is known to be a costly task; nevertheless, pre-training methods have only
recently been investigated. Due to this cost, unsupervised pre-training has
been heavily favored. In this work, we tackle the case of real-time 3D semantic
segmentation of sparse autonomous driving LiDAR scans. Such datasets have been
increasingly released, but each has a unique label set. We propose here an
intermediate-level label set called coarse labels, which can easily be used on
any existing and future autonomous driving datasets, thus allowing all the data
available to be leveraged at once without any additional manual labeling. This
way, we have access to a larger dataset, alongside a simple task of semantic
segmentation. With it, we introduce a new pre-training task: coarse label
pre-training, also called COLA. We thoroughly analyze the impact of COLA on
various datasets and architectures and show that it yields a noticeable
performance improvement, especially when only a small dataset is available for
the finetuning task.
- Abstract(参考訳): 転送学習は、2次元コンピュータビジョンにおいて、利用可能な大量のデータを活用して、取得やアノテーションのコストがかかるため、サイズが制限されたデータセットでハイパフォーマンスを達成するための実証済みの技術である。
3Dでは、アノテーションはコストのかかるタスクであることが知られているが、しかしながら、事前学習手法は近年研究されているばかりである。
このコストのため、教師なしの事前訓練が好まれている。
本研究では,スパース自動運転LiDARスキャンのリアルタイムな3次元セマンティックセマンティックセマンティックセグメンテーションを実現する。
このようなデータセットはますますリリースされているが、それぞれにユニークなラベルセットがある。
ここでは、粗いラベルと呼ばれる中間レベルのラベルセットを提案する。これは、既存のおよび将来の自動運転データセットで簡単に使用でき、これにより、追加の手動ラベルなしで利用可能なすべてのデータを一度に活用することができる。
このようにして、セマンティックセグメンテーションの簡単なタスクとともに、より大きなデータセットにアクセスできます。
そこで我々は,COLA(Coarse label pre-training)と呼ばれる新しい事前学習タスクを導入する。
我々は、COLAが様々なデータセットやアーキテクチャに与える影響を徹底的に分析し、特に微調整タスクに小さなデータセットしか利用できない場合、顕著なパフォーマンス改善をもたらすことを示す。
関連論文リスト
- Discwise Active Learning for LiDAR Semantic Segmentation [92.92714645987083]
アクティブラーニング(AL)は、データセットを反復的かつインテリジェントにラベル付けできるソリューションを提供する。
我々は,各イテレーションにおいて,グローバル座標上の1フレームの領域を問合せし,全フレームを同時にラベル付けするディスクワイズアプローチ(DiAL)を提案する。
論文 参考訳(メタデータ) (2023-09-23T06:08:22Z) - SPOT: Scalable 3D Pre-training via Occupancy Prediction for Learning Transferable 3D Representations [76.45009891152178]
トレーニング-ファインタニングアプローチは、さまざまな下流データセットとタスクをまたいだトレーニング済みのバックボーンを微調整することで、ラベル付けの負担を軽減することができる。
本稿では, 一般表現学習が, 占領予測のタスクを通じて達成できることを, 初めて示す。
本研究は,LiDAR 点の理解を促進するとともに,LiDAR の事前訓練における今後の進歩の道を開くことを目的とする。
論文 参考訳(メタデータ) (2023-09-19T11:13:01Z) - Label Name is Mantra: Unifying Point Cloud Segmentation across
Heterogeneous Datasets [17.503843467554592]
本稿では,異なるラベル集合を持つ異種データセットからの学習を支援する原理的アプローチを提案する。
我々の考えは、学習済みの言語モデルを用いて、ラベル名を用いて離散ラベルを連続的な潜在空間に埋め込むことである。
私たちのモデルは最先端の技術を大きなマージンで上回ります。
論文 参考訳(メタデータ) (2023-03-19T06:14:22Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - Primitive3D: 3D Object Dataset Synthesis from Randomly Assembled
Primitives [44.03149443379618]
アノテーションで大量の3Dオブジェクトを自動生成するコスト効率のよい手法を提案する。
これらのオブジェクトはプリミティブから派生した部分ラベルで自動アノテーションされる。
生成したデータセットに対する学習のオーバーヘッドが大きいことを考慮し,データセットの蒸留戦略を提案する。
論文 参考訳(メタデータ) (2022-05-25T10:07:07Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。