論文の概要: Monocular 3D Object Detection with LiDAR Guided Semi Supervised Active
Learning
- arxiv url: http://arxiv.org/abs/2307.08415v1
- Date: Mon, 17 Jul 2023 11:55:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 13:34:17.720368
- Title: Monocular 3D Object Detection with LiDAR Guided Semi Supervised Active
Learning
- Title(参考訳): LiDAR誘導半教師型アクティブラーニングによる単眼3次元物体検出
- Authors: Aral Hekimoglu, Michael Schmidt, Alvaro Marcos-Ramiro
- Abstract要約: LiDAR誘導を用いたモノクロ3次元物体検出のための新しい半教師付き能動学習フレームワーク(SSAL)を提案する。
我々はLiDARを用いて、単分子型3D検出器のデータ選択とトレーニングを、推論フェーズのオーバーヘッドを伴わずにガイドする。
トレーニング戦略は,BEV平均精度(AP)を2.02倍に向上させることで,KITTI 3Dと鳥眼視(BEV)単眼物体検出の公式ベンチマークでトップとなる。
- 参考スコア(独自算出の注目度): 2.16117348324501
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We propose a novel semi-supervised active learning (SSAL) framework for
monocular 3D object detection with LiDAR guidance (MonoLiG), which leverages
all modalities of collected data during model development. We utilize LiDAR to
guide the data selection and training of monocular 3D detectors without
introducing any overhead in the inference phase. During training, we leverage
the LiDAR teacher, monocular student cross-modal framework from semi-supervised
learning to distill information from unlabeled data as pseudo-labels. To handle
the differences in sensor characteristics, we propose a data noise-based
weighting mechanism to reduce the effect of propagating noise from LiDAR
modality to monocular. For selecting which samples to label to improve the
model performance, we propose a sensor consistency-based selection score that
is also coherent with the training objective. Extensive experimental results on
KITTI and Waymo datasets verify the effectiveness of our proposed framework. In
particular, our selection strategy consistently outperforms state-of-the-art
active learning baselines, yielding up to 17% better saving rate in labeling
costs. Our training strategy attains the top place in KITTI 3D and
birds-eye-view (BEV) monocular object detection official benchmarks by
improving the BEV Average Precision (AP) by 2.02.
- Abstract(参考訳): そこで本研究では,LiDAR誘導(MonoLiG)を用いたモノクル3次元物体検出のための,新しい半教師付き能動学習フレームワークを提案する。
lidarを用いて,単眼3次元検出器のデータ選択とトレーニングを,推論フェーズでオーバーヘッドを発生させることなく指導する。
学習中に,半教師による学習から,ラベルなしデータからの情報を擬似ラベルとして蒸留する,単項学習クロスモーダルフレームワークであるlidarを活用した。
センサ特性の違いに対処するため,LiDARから単分子への伝搬雑音の影響を低減するために,データノイズに基づく重み付け機構を提案する。
モデル性能を向上させるためにラベル付けするサンプルを選択するために,学習目標と整合するセンサ一貫性に基づく選択スコアを提案する。
KITTIとWaymoデータセットの大規模な実験結果により,提案フレームワークの有効性が検証された。
特に、我々の選択戦略は、最先端のアクティブラーニングベースラインを一貫して上回り、ラベル付けコストの最大17%の節約率を得る。
トレーニング戦略は,BEV平均精度(AP)を2.02倍に向上させることで,KITTI 3Dと鳥眼視(BEV)単眼物体検出の公式ベンチマークでトップとなる。
関連論文リスト
- Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。
RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。
本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文 参考訳(メタデータ) (2024-07-11T14:58:49Z) - Multi-Modal Data-Efficient 3D Scene Understanding for Autonomous Driving [58.16024314532443]
我々は、異なるLiDARスキャンからレーザービーム操作を統合するフレームワークであるLaserMix++を導入し、データ効率の学習を支援するためにLiDAR-カメラ対応を組み込んだ。
結果は、LaserMix++が完全に教師付き代替よりも優れており、5倍のアノテーションで同等の精度を実現していることを示している。
この大幅な進歩は、LiDARベースの3Dシーン理解システムにおける広範囲なラベル付きデータへの依存を減らすための半教師付きアプローチの可能性を示している。
論文 参考訳(メタデータ) (2024-05-08T17:59:53Z) - ODM3D: Alleviating Foreground Sparsity for Semi-Supervised Monocular 3D
Object Detection [15.204935788297226]
ODM3Dフレームワークは、トレーニング中にLiDARドメインの知識を単分子検出器に注入するために、様々なレベルでのクロスモーダルな知識蒸留を必要とする。
既存手法の準最適トレーニングの主要因として,前景の空間空間を同定することにより,LiDAR点に埋め込まれた正確な位置化情報を活用する。
KITTI検証とテストベンチマークの両方で1位にランクインし、教師付きまたは半教師付きである既存のモノクラー手法をはるかに上回っている。
論文 参考訳(メタデータ) (2023-10-28T07:12:09Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - LiDAL: Inter-frame Uncertainty Based Active Learning for 3D LiDAR
Semantic Segmentation [36.69417080183985]
LiDALは3次元LiDARセマンティックセグメンテーションのための新しいアクティブラーニング手法である。
本稿では,LiDARフレーム間の不確実性を利用したLiDALを提案する。
我々は、5%未満のアノテーションで完全に教師付き学習のパフォーマンスを95%達成する。
論文 参考訳(メタデータ) (2022-11-11T04:47:33Z) - Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T04:54:03Z) - Boosting 3D Object Detection by Simulating Multimodality on Point Clouds [51.87740119160152]
本稿では,LiDAR 画像検出器に追従する特徴や応答をシミュレートすることで,単一モダリティ (LiDAR) 3次元物体検出器を高速化する新しい手法を提案する。
このアプローチでは、単一モダリティ検出器をトレーニングする場合のみ、LiDARイメージデータを必要とし、十分にトレーニングされた場合には、推論時にのみLiDARデータが必要である。
nuScenesデータセットの実験結果から,本手法はSOTA LiDARのみの3D検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-06-30T01:44:30Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - MonoDistill: Learning Spatial Features for Monocular 3D Object Detection [80.74622486604886]
本稿では,LiDAR信号からの空間情報を単分子3D検出器に導入するための簡易かつ効果的な手法を提案する。
得られたデータを用いて、ベースラインモデルと同じアーキテクチャで3D検出器をトレーニングする。
実験の結果,提案手法はベースラインモデルの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-01-26T09:21:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。