論文の概要: Semi-supervised 3D Object Detection with Proficient Teachers
- arxiv url: http://arxiv.org/abs/2207.12655v1
- Date: Tue, 26 Jul 2022 04:54:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-27 12:48:54.819349
- Title: Semi-supervised 3D Object Detection with Proficient Teachers
- Title(参考訳): 熟練教師による半教師付き3次元物体検出
- Authors: Junbo Yin, Jin Fang, Dingfu Zhou, Liangjun Zhang, Cheng-Zhong Xu,
Jianbing Shen, and Wenguan Wang
- Abstract要約: 自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
- 参考スコア(独自算出の注目度): 114.54835359657707
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dominated point cloud-based 3D object detectors in autonomous driving
scenarios rely heavily on the huge amount of accurately labeled samples,
however, 3D annotation in the point cloud is extremely tedious, expensive and
time-consuming. To reduce the dependence on large supervision, semi-supervised
learning (SSL) based approaches have been proposed. The Pseudo-Labeling
methodology is commonly used for SSL frameworks, however, the low-quality
predictions from the teacher model have seriously limited its performance. In
this work, we propose a new Pseudo-Labeling framework for semi-supervised 3D
object detection, by enhancing the teacher model to a proficient one with
several necessary designs. First, to improve the recall of pseudo labels, a
Spatialtemporal Ensemble (STE) module is proposed to generate sufficient seed
boxes. Second, to improve the precision of recalled boxes, a Clusteringbased
Box Voting (CBV) module is designed to get aggregated votes from the clustered
seed boxes. This also eliminates the necessity of sophisticated thresholds to
select pseudo labels. Furthermore, to reduce the negative influence of wrongly
pseudo-labeled samples during the training, a soft supervision signal is
proposed by considering Box-wise Contrastive Learning (BCL). The effectiveness
of our model is verified on both ONCE and Waymo datasets. For example, on ONCE,
our approach significantly improves the baseline by 9.51 mAP. Moreover, with
half annotations, our model outperforms the oracle model with full annotations
on Waymo.
- Abstract(参考訳): 自動運転のシナリオで支配的なポイントクラウドベースの3dオブジェクト検出器は、大量の正確なラベル付きサンプルに大きく依存しているが、ポイントクラウド内の3dアノテーションは非常に退屈で高価で時間がかかります。
大規模監視への依存を軽減するため,半教師付き学習(SSL)に基づくアプローチが提案されている。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は性能を著しく制限している。
そこで,本稿では,教師モデルを拡張し,必要な設計を多用することで,半教師付き3次元物体検出のための新しい擬似ラベルフレームワークを提案する。
まず、擬似ラベルのリコールを改善するため、十分なシードボックスを生成するために空間時間アンサンブル(ste)モジュールを提案する。
第2に、リコールボックスの精度を改善するために、クラスタリングベースのBox Voting(CBV)モジュールは、クラスタ化されたシードボックスから集計された投票を取得するように設計されている。
これにより、擬似ラベルを選択するための洗練されたしきい値の必要性もなくなる。
さらに、トレーニング中の擬似ラベルサンプルの負の影響を低減するために、Box-wise Contrastive Learning (BCL) を考慮したソフト監視信号を提案する。
本モデルの有効性をONCEとWaymoの両方のデータセットで検証する。
例えば、ONCEでは、ベースラインを 9.51 mAP で大幅に改善する。
さらに、半分のアノテーションで、私たちのモデルはWaymoの完全なアノテーションでオラクルモデルより優れています。
関連論文リスト
- TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Diffusion-SS3D: Diffusion Model for Semi-supervised 3D Object Detection [77.23918785277404]
半教師付き3次元物体検出のための拡散モデルを用いて,擬似ラベルの品質向上に向けた新たな視点であるDiffusion-SS3Dを提案する。
具体的には、劣化した3Dオブジェクトサイズとクラスラベル、分布を生成し、拡散モデルをデノナイズプロセスとして利用し、バウンディングボックス出力を得る。
我々は,ScanNetとSUN RGB-Dベンチマークデータセットの実験を行い,既存手法に対する最先端性能の実現を実証した。
論文 参考訳(メタデータ) (2023-12-05T18:54:03Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Exploring Active 3D Object Detection from a Generalization Perspective [58.597942380989245]
不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
論文 参考訳(メタデータ) (2023-01-23T02:43:03Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Active Self-Semi-Supervised Learning for Few Labeled Samples [4.713652957384158]
アノテーションを限定した深層モデルのトレーニングは、さまざまな実践領域に適用する上で、大きな課題となる。
我々は,シンプルで効果的な自己半教師付き学習(AS3L)を提案する。
擬似ラベル(PPL)を用いたAS3Lブートストラップ半教師付きモデル
我々は,正確なPPLを得るために,能動的学習とラベル伝搬戦略を開発した。
論文 参考訳(メタデータ) (2022-03-09T07:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。