論文の概要: OC3D: Weakly Supervised Outdoor 3D Object Detection with Only Coarse Click Annotation
- arxiv url: http://arxiv.org/abs/2408.08092v2
- Date: Fri, 16 Aug 2024 02:28:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-19 10:48:24.414307
- Title: OC3D: Weakly Supervised Outdoor 3D Object Detection with Only Coarse Click Annotation
- Title(参考訳): OC3D:粗いクリックアノテートのみによる屋外3Dオブジェクト検出を弱めに監視
- Authors: Qiming Xia, Hongwei Lin, Wei Ye, Hai Wu, Yadan Luo, Shijia Zhao, Xin Li, Chenglu Wen,
- Abstract要約: LiDARポイントクラウドからの3D検出器のトレーニングは通常、高価なバウンディングボックスアノテーションに依存している。
本稿では,3D 点雲の鳥の目視でのみ粗いクリックを必要とする,革新的な弱制御手法である OC3D を提案する。
- 参考スコア(独自算出の注目度): 21.28388955131355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LiDAR-based outdoor 3D object detection has received widespread attention. However, training 3D detectors from the LiDAR point cloud typically relies on expensive bounding box annotations. This paper presents OC3D, an innovative weakly supervised method requiring only coarse clicks on the bird's eye view of the 3D point cloud. A key challenge here is the absence of complete geometric descriptions of the target objects from such simple click annotations. To address this problem, our proposed OC3D adopts a two-stage strategy. In the first stage, we initially design a novel dynamic and static classification strategy and then propose the Click2Box and Click2Mask modules to generate box-level and mask-level pseudo-labels for static and dynamic instances, respectively. In the second stage, we design a Mask2Box module, leveraging the learning capabilities of neural networks to update mask-level pseudo-labels, which contain less information, to box-level pseudo-labels. Experimental results on the widely used KITTI and nuScenes datasets demonstrate that our OC3D with only coarse clicks achieves state-of-the-art performance compared to weakly-supervised 3D detection methods. Combining OC3D with a missing click mining strategy, we propose an OC3D++ pipeline, which requires only 0.2% annotation cost in the KITTI dataset to achieve performance comparable to fully supervised methods. The code will be made publicly available.
- Abstract(参考訳): LiDARベースの屋外3Dオブジェクト検出は広く注目を集めている。
しかし、LiDARポイントクラウドからの3D検出器のトレーニングは通常、高価なバウンディングボックスアノテーションに依存している。
本稿では,3D 点雲の鳥の目視でのみ粗いクリックを必要とする,革新的な弱制御手法である OC3D を提案する。
ここでの重要な課題は、このような単純なクリックアノテーションからターゲットオブジェクトの完全な幾何学的記述がないことである。
この問題に対処するため,提案したOC3Dは2段階戦略を採用する。
最初の段階では、新しい動的分類戦略と静的分類戦略を設計し、次にClick2BoxとClick2Maskモジュールを提案し、それぞれ静的および動的インスタンス用のボックスレベルとマスクレベルの擬似ラベルを生成する。
第2段階では、ニューラルネットワークの学習能力を活用して、少ない情報を含むマスクレベルの擬似ラベルをボックスレベルの擬似ラベルに更新するMask2Boxモジュールを設計する。
広く使われているKITTIとnuScenesデータセットの実験結果から, 粗いクリックしか持たないOC3Dは, 弱教師付き3D検出法と比較して, 最先端の性能を実現することが示された。
OC3Dと欠落したクリックマイニング戦略を組み合わせたOC3D++パイプラインを提案する。
コードは公開されます。
関連論文リスト
- ALPI: Auto-Labeller with Proxy Injection for 3D Object Detection using 2D Labels Only [5.699475977818167]
3Dオブジェクト検出は、自動運転車、ロボット工学、拡張現実など、さまざまな応用において重要な役割を果たす。
画像から2次元境界ボックスアノテーションにのみ依存する弱教師付き3次元アノテータを提案する。
論文 参考訳(メタデータ) (2024-07-24T11:58:31Z) - 3DHacker: Spectrum-based Decision Boundary Generation for Hard-label 3D
Point Cloud Attack [64.83391236611409]
そこで本研究では,クラスラベルの知識にのみ依存して,敵対的なサンプルを生成する新しい3D攻撃手法を提案する。
3DHackerは、難しいハードラベル設定でも、既存の3D攻撃の攻撃性能と敵のクオリティを競争力で上回っている。
論文 参考訳(メタデータ) (2023-08-15T03:29:31Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - DDS3D: Dense Pseudo-Labels with Dynamic Threshold for Semi-Supervised 3D
Object Detection [15.440609044002722]
本報告では, 簡易かつ効果的な半教師付き3次元物体検出器である3Dについて述べる。
これら2つのコンポーネントに適合して、我々の3Dは、最先端の半教師付き3Dオブジェクト検出を、データセットで3.1%、サイクリストで2.1%で上回っている。
論文 参考訳(メタデータ) (2023-03-09T07:30:53Z) - Exploring Active 3D Object Detection from a Generalization Perspective [58.597942380989245]
不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
論文 参考訳(メタデータ) (2023-01-23T02:43:03Z) - Semi-supervised 3D Object Detection via Adaptive Pseudo-Labeling [18.209409027211404]
3次元物体検出はコンピュータビジョンにおいて重要な課題である。
既存のほとんどのメソッドでは、多くの高品質な3Dアノテーションが必要です。
本研究では,屋外3次元物体検出タスクのための擬似ラベルに基づく新しい半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-15T02:58:43Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Weakly Supervised 3D Object Detection from Point Clouds [27.70180601788613]
3Dオブジェクト検出は、特定のクラスに属するオブジェクトの3D境界ボックスを検出し、ローカライズすることを目的としている。
既存の3Dオブジェクト検出器は、トレーニング中にアノテーション付き3Dバウンディングボックスに依存している。
基礎となる真理3D境界ボックスを使わずに点雲からの3Dオブジェクト検出を弱教師付きで行うためのフレームワークであるVS3Dを提案する。
論文 参考訳(メタデータ) (2020-07-28T03:30:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。