論文の概要: Exploring Active 3D Object Detection from a Generalization Perspective
- arxiv url: http://arxiv.org/abs/2301.09249v1
- Date: Mon, 23 Jan 2023 02:43:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 14:21:23.992582
- Title: Exploring Active 3D Object Detection from a Generalization Perspective
- Title(参考訳): 一般化の視点からのアクティブ3次元物体検出の探索
- Authors: Yadan Luo, Zhuoxiao Chen, Zijian Wang, Xin Yu, Zi Huang, Mahsa
Baktashmotlagh
- Abstract要約: 不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
- 参考スコア(独自算出の注目度): 58.597942380989245
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: To alleviate the high annotation cost in LiDAR-based 3D object detection,
active learning is a promising solution that learns to select only a small
portion of unlabeled data to annotate, without compromising model performance.
Our empirical study, however, suggests that mainstream uncertainty-based and
diversity-based active learning policies are not effective when applied in the
3D detection task, as they fail to balance the trade-off between point cloud
informativeness and box-level annotation costs. To overcome this limitation, we
jointly investigate three novel criteria in our framework Crb for point cloud
acquisition - label conciseness}, feature representativeness and geometric
balance, which hierarchically filters out the point clouds of redundant 3D
bounding box labels, latent features and geometric characteristics (e.g., point
cloud density) from the unlabeled sample pool and greedily selects informative
ones with fewer objects to annotate. Our theoretical analysis demonstrates that
the proposed criteria align the marginal distributions of the selected subset
and the prior distributions of the unseen test set, and minimizes the upper
bound of the generalization error. To validate the effectiveness and
applicability of \textsc{Crb}, we conduct extensive experiments on the two
benchmark 3D object detection datasets of KITTI and Waymo and examine both
one-stage (\textit{i.e.}, \textsc{Second}) and two-stage 3D detectors (i.e.,
Pv-rcnn). Experiments evidence that the proposed approach outperforms existing
active learning strategies and achieves fully supervised performance requiring
$1\%$ and $8\%$ annotations of bounding boxes and point clouds, respectively.
Source code: https://github.com/Luoyadan/CRB-active-3Ddet.
- Abstract(参考訳): LiDARベースの3Dオブジェクト検出における高アノテーションコストを軽減するため、アクティブラーニングは、モデル性能を損なうことなく、少量のラベルなしデータをアノテートするように選択する、有望なソリューションである。
しかし,本研究では,不確実性と多様性に基づくアクティブ・ラーニング・ポリシーは,ポイント・クラウド・インフォメーションとボックスレベルのアノテーションコストのトレードオフのバランスが取れないため,3d検出タスクに適用しても有効ではないことが示唆された。
この制限を克服するために,我々のフレームワーク Crb for point cloud acquisition - label conciseness}, feature representativeness and geometry balance の3つの新しい基準を共同で検討した。
理論的解析により,提案基準は選択された部分集合の限界分布と未確認テスト集合の先行分布とを一致させ,一般化誤差の上限を最小化することを示した。
KITTI と Waymo の2つのベンチマーク 3D オブジェクト検出データセットにおいて,その有効性と適用性を検証するため,1段目 (\textit{i.e.}, \textsc{Second}) と2段目 (Pv-rcnn) の2つの3D検出器 (Pv-rcnn) の2つの実験を行った。
実験によると、提案手法は既存のアクティブな学習戦略より優れており、それぞれ境界ボックスと点クラウドのアノテーションを1\%と8\%で完全に教師付きのパフォーマンスを達成する。
ソースコード:https://github.com/Luoyadan/CRB-active-3Ddet。
関連論文リスト
- Distribution Discrepancy and Feature Heterogeneity for Active 3D Object Detection [18.285299184361598]
LiDARベースの3Dオブジェクト検出は、自律走行とロボット工学の発展にとって重要な技術である。
DDFH(Dis Distribution Discrepancy and Feature Heterogeneity)と呼ばれる新しい効果的なアクティブラーニング手法を提案する。
幾何学的特徴とモデル埋め込みを同時に考慮し、インスタンスレベルとフレームレベルの両方の観点から情報を評価する。
論文 参考訳(メタデータ) (2024-09-09T08:26:11Z) - Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。
RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。
本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文 参考訳(メタデータ) (2024-07-11T14:58:49Z) - Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object
Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。
我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文 参考訳(メタデータ) (2024-01-10T08:56:07Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T04:54:03Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。