論文の概要: Exploring Active 3D Object Detection from a Generalization Perspective
- arxiv url: http://arxiv.org/abs/2301.09249v1
- Date: Mon, 23 Jan 2023 02:43:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 14:21:23.992582
- Title: Exploring Active 3D Object Detection from a Generalization Perspective
- Title(参考訳): 一般化の視点からのアクティブ3次元物体検出の探索
- Authors: Yadan Luo, Zhuoxiao Chen, Zijian Wang, Xin Yu, Zi Huang, Mahsa
Baktashmotlagh
- Abstract要約: 不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
- 参考スコア(独自算出の注目度): 58.597942380989245
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: To alleviate the high annotation cost in LiDAR-based 3D object detection,
active learning is a promising solution that learns to select only a small
portion of unlabeled data to annotate, without compromising model performance.
Our empirical study, however, suggests that mainstream uncertainty-based and
diversity-based active learning policies are not effective when applied in the
3D detection task, as they fail to balance the trade-off between point cloud
informativeness and box-level annotation costs. To overcome this limitation, we
jointly investigate three novel criteria in our framework Crb for point cloud
acquisition - label conciseness}, feature representativeness and geometric
balance, which hierarchically filters out the point clouds of redundant 3D
bounding box labels, latent features and geometric characteristics (e.g., point
cloud density) from the unlabeled sample pool and greedily selects informative
ones with fewer objects to annotate. Our theoretical analysis demonstrates that
the proposed criteria align the marginal distributions of the selected subset
and the prior distributions of the unseen test set, and minimizes the upper
bound of the generalization error. To validate the effectiveness and
applicability of \textsc{Crb}, we conduct extensive experiments on the two
benchmark 3D object detection datasets of KITTI and Waymo and examine both
one-stage (\textit{i.e.}, \textsc{Second}) and two-stage 3D detectors (i.e.,
Pv-rcnn). Experiments evidence that the proposed approach outperforms existing
active learning strategies and achieves fully supervised performance requiring
$1\%$ and $8\%$ annotations of bounding boxes and point clouds, respectively.
Source code: https://github.com/Luoyadan/CRB-active-3Ddet.
- Abstract(参考訳): LiDARベースの3Dオブジェクト検出における高アノテーションコストを軽減するため、アクティブラーニングは、モデル性能を損なうことなく、少量のラベルなしデータをアノテートするように選択する、有望なソリューションである。
しかし,本研究では,不確実性と多様性に基づくアクティブ・ラーニング・ポリシーは,ポイント・クラウド・インフォメーションとボックスレベルのアノテーションコストのトレードオフのバランスが取れないため,3d検出タスクに適用しても有効ではないことが示唆された。
この制限を克服するために,我々のフレームワーク Crb for point cloud acquisition - label conciseness}, feature representativeness and geometry balance の3つの新しい基準を共同で検討した。
理論的解析により,提案基準は選択された部分集合の限界分布と未確認テスト集合の先行分布とを一致させ,一般化誤差の上限を最小化することを示した。
KITTI と Waymo の2つのベンチマーク 3D オブジェクト検出データセットにおいて,その有効性と適用性を検証するため,1段目 (\textit{i.e.}, \textsc{Second}) と2段目 (Pv-rcnn) の2つの3D検出器 (Pv-rcnn) の2つの実験を行った。
実験によると、提案手法は既存のアクティブな学習戦略より優れており、それぞれ境界ボックスと点クラウドのアノテーションを1\%と8\%で完全に教師付きのパフォーマンスを達成する。
ソースコード:https://github.com/Luoyadan/CRB-active-3Ddet。
関連論文リスト
- Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T04:54:03Z) - Dual Adaptive Transformations for Weakly Supervised Point Cloud
Segmentation [78.6612285236938]
弱制御点雲分割のための新しいDATモデル(textbfDual textbfAdaptive textbfTransformations)を提案する。
我々は,大規模S3DISデータセットとScanNet-V2データセットの2つの人気バックボーンを用いたDATモデルの評価を行った。
論文 参考訳(メタデータ) (2022-07-19T05:43:14Z) - Exploring Diversity-based Active Learning for 3D Object Detection in
Autonomous Driving [42.803690431227814]
本研究では,多様性に基づくアクティブラーニング(AL)を,アノテーションの負担を軽減するための潜在的解決策として検討する。
選択したサンプルの空間的・時間的多様性を強制する新しい取得関数を提案する。
提案手法がnuScenesデータセットに与える影響を実証し,既存のAL戦略を著しく上回ることを示す。
論文 参考訳(メタデータ) (2022-05-16T14:21:30Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Unsupervised Learning on 3D Point Clouds by Clustering and Contrasting [11.64827192421785]
教師なし表現学習は、人間の介入なしに機能を自動抽出するための有望な方向である。
本稿では、ポイントワイドおよびグローバルな特徴の学習を行うために、textbfConClu という、一般的な教師なしアプローチを提案する。
論文 参考訳(メタデータ) (2022-02-05T12:54:17Z) - Semi-supervised 3D Object Detection via Adaptive Pseudo-Labeling [18.209409027211404]
3次元物体検出はコンピュータビジョンにおいて重要な課題である。
既存のほとんどのメソッドでは、多くの高品質な3Dアノテーションが必要です。
本研究では,屋外3次元物体検出タスクのための擬似ラベルに基づく新しい半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-15T02:58:43Z) - 3D Spatial Recognition without Spatially Labeled 3D [127.6254240158249]
Weakly-supervised framework for Point cloud Recognitionを紹介する。
We show that WyPR can detected and segment objects in point cloud data without access any space labels at training time。
論文 参考訳(メタデータ) (2021-05-13T17:58:07Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。