論文の概要: Are Dense Labels Always Necessary for 3D Object Detection from Point
Cloud?
- arxiv url: http://arxiv.org/abs/2403.02818v1
- Date: Tue, 5 Mar 2024 09:38:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 15:19:00.232299
- Title: Are Dense Labels Always Necessary for 3D Object Detection from Point
Cloud?
- Title(参考訳): 高密度ラベルはポイントクラウドからの3dオブジェクト検出に必要か?
- Authors: Chenqiang Gao, Chuandong Liu, Jun Shu, Fangcen Liu, Jiang Liu, Luyu
Yang, Xinbo Gao, and Deyu Meng
- Abstract要約: 現在のSOTA(State-of-the-art)3Dオブジェクト検出法は、トレーニングのために大量の3Dバウンディングボックスアノテーションを必要とすることが多い。
シーン毎に1つの3Dオブジェクトにアノテートするだけでよい,スプリスアノテートされた新しいフレームワークを提案する。
SS3D++法は、代わりに3D検出器のトレーニングを改善し、完全に注釈付けされたシーン生成を確実にする。
- 参考スコア(独自算出の注目度): 72.40353149833109
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current state-of-the-art (SOTA) 3D object detection methods often require a
large amount of 3D bounding box annotations for training. However, collecting
such large-scale densely-supervised datasets is notoriously costly. To reduce
the cumbersome data annotation process, we propose a novel sparsely-annotated
framework, in which we just annotate one 3D object per scene. Such a sparse
annotation strategy could significantly reduce the heavy annotation burden,
while inexact and incomplete sparse supervision may severely deteriorate the
detection performance. To address this issue, we develop the SS3D++ method that
alternatively improves 3D detector training and confident fully-annotated scene
generation in a unified learning scheme. Using sparse annotations as seeds, we
progressively generate confident fully-annotated scenes based on designing a
missing-annotated instance mining module and reliable background mining module.
Our proposed method produces competitive results when compared with SOTA
weakly-supervised methods using the same or even more annotation costs.
Besides, compared with SOTA fully-supervised methods, we achieve on-par or even
better performance on the KITTI dataset with about 5x less annotation cost, and
90% of their performance on the Waymo dataset with about 15x less annotation
cost. The additional unlabeled training scenes could further boost the
performance. The code will be available at https://github.com/gaocq/SS3D2.
- Abstract(参考訳): 現在のSOTA(State-of-the-art)3Dオブジェクト検出法は、トレーニングのために大量の3Dバウンディングボックスアノテーションを必要とすることが多い。
しかし、このような大規模に監督されたデータセットの収集は、非常にコストがかかる。
データアノテーションの面倒な処理を減らすために、我々はシーンごとに1つの3dオブジェクトに注釈を付ける新しいアノテーション付きフレームワークを提案する。
このようなスパースアノテーション戦略は、過剰なアノテーション負担を著しく軽減し、不正確なスパース監視は検出性能を著しく低下させる可能性がある。
そこで,本稿では,ss3d++法を開発し,統一学習方式で3次元検出訓練と完全注釈シーン生成を交互に改善する。
スパースアノテーションをシードとして使用し、欠落したインスタンスマイニングモジュールと信頼性のあるバックグラウンドマイニングモジュールの設計に基づいて、信頼性の高い完全アノテートシーンを徐々に生成する。
提案手法は,同じあるいはそれ以上のアノテーションコストを用いたSOTA弱教師付き手法と比較して,競争力のある結果が得られる。
さらに,soma完全教師付き手法と比較して,アノテーションコストの約5倍,waymoデータセットのパフォーマンスの90%を約15倍のアノテーションコストで,kittiデータセットで同等あるいはそれ以上のパフォーマンスを実現している。
追加の未ラベルのトレーニングシーンはパフォーマンスをさらに向上させる可能性がある。
コードはhttps://github.com/gaocq/ss3d2で入手できる。
関連論文リスト
- Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - ALPI: Auto-Labeller with Proxy Injection for 3D Object Detection using 2D Labels Only [5.699475977818167]
3Dオブジェクト検出は、自動運転車、ロボット工学、拡張現実など、さまざまな応用において重要な役割を果たす。
画像から2次元境界ボックスアノテーションにのみ依存する弱教師付き3次元アノテータを提案する。
論文 参考訳(メタデータ) (2024-07-24T11:58:31Z) - Weakly Supervised 3D Object Detection with Multi-Stage Generalization [62.96670547848691]
擬似ラベル生成と多段階一般化を含むBA$2$-Detを導入する。
一般化の3つの段階、完全から部分へ、静的から動的へ、そして遠い距離へ進む。
BA$2$-Detは、KITTIデータセットの20%の相対的な改善を達成できる。
論文 参考訳(メタデータ) (2023-06-08T17:58:57Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - Semi-supervised 3D Object Detection via Adaptive Pseudo-Labeling [18.209409027211404]
3次元物体検出はコンピュータビジョンにおいて重要な課題である。
既存のほとんどのメソッドでは、多くの高品質な3Dアノテーションが必要です。
本研究では,屋外3次元物体検出タスクのための擬似ラベルに基づく新しい半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-15T02:58:43Z) - Weakly Supervised Learning of Rigid 3D Scene Flow [81.37165332656612]
本研究では,剛体体として動くエージェント群によって説明できる3次元シーンを多用したデータ駆動シーンフロー推定アルゴリズムを提案する。
4種類の自律運転データセットにおいて,提案手法の有効性と一般化能力を示す。
論文 参考訳(メタデータ) (2021-02-17T18:58:02Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。