論文の概要: Harnessing Uncertainty-aware Bounding Boxes for Unsupervised 3D Object Detection
- arxiv url: http://arxiv.org/abs/2408.00619v1
- Date: Thu, 1 Aug 2024 15:01:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-04 20:16:43.420388
- Title: Harnessing Uncertainty-aware Bounding Boxes for Unsupervised 3D Object Detection
- Title(参考訳): 教師なし3次元物体検出のための不確かさを意識したバウンディングボックス
- Authors: Ruiyang Zhang, Hu Zhang, Hang Yu, Zhedong Zheng,
- Abstract要約: 教師なしの3Dオブジェクト検出は、LiDARポイントのようなラベル付けされていない生データから興味のあるオブジェクトを識別することを目的としている。
最近のアプローチでは、クラスタリングアルゴリズムから擬似3Dバウンディングボックス(3D bbox)を採用してモデルトレーニングを初期化し、擬似ラベルと訓練されたモデルの両方を反復的に更新する。
疑似bboxの悪影響を軽減するための新しい不確実性認識フレームワークを提案する。
- 参考スコア(独自算出の注目度): 22.297964850282177
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised 3D object detection aims to identify objects of interest from unlabeled raw data, such as LiDAR points. Recent approaches usually adopt pseudo 3D bounding boxes (3D bboxes) from clustering algorithm to initialize the model training, and then iteratively updating both pseudo labels and the trained model. However, pseudo bboxes inevitably contain noises, and such inaccurate annotation accumulates to the final model, compromising the performance. Therefore, in an attempt to mitigate the negative impact of pseudo bboxes, we introduce a new uncertainty-aware framework. In particular, Our method consists of two primary components: uncertainty estimation and uncertainty regularization. (1) In the uncertainty estimation phase, we incorporate an extra auxiliary detection branch alongside the primary detector. The prediction disparity between the primary and auxiliary detectors is leveraged to estimate uncertainty at the box coordinate level, including position, shape, orientation. (2) Based on the assessed uncertainty, we regularize the model training via adaptively adjusting every 3D bboxes coordinates. For pseudo bbox coordinates with high uncertainty, we assign a relatively low loss weight. Experiment verifies that the proposed method is robust against the noisy pseudo bboxes, yielding substantial improvements on nuScenes and Lyft compared to existing techniques, with increases of 6.9% in AP$_{BEV}$ and 2.5% in AP$_{3D}$ on nuScenes, and 2.2% in AP$_{BEV}$ and 1.0% in AP$_{3D}$ on Lyft.
- Abstract(参考訳): 教師なしの3Dオブジェクト検出は、LiDARポイントのようなラベル付けされていない生データから興味のあるオブジェクトを識別することを目的としている。
最近のアプローチでは、クラスタリングアルゴリズムから擬似3Dバウンディングボックス(3D bbox)を採用してモデルトレーニングを初期化し、擬似ラベルと訓練されたモデルの両方を反復的に更新する。
しかし、偽のボックスには必然的にノイズが含まれており、そのような不正確なアノテーションは最終モデルに蓄積され、性能を損なう。
そこで, 疑似bboxの悪影響を軽減するために, 新たな不確実性認識フレームワークを導入する。
特に,本手法は,不確実性推定と不確実性正則化という2つの主成分から構成される。
1) 不確実性推定フェーズでは, 予備検出枝を主検出器の横に組み込む。
一次検出器と補助検出器の間の予測格差を利用して、位置、形状、方向を含むボックス座標レベルでの不確かさを推定する。
2) 評価された不確実性に基づき, 各3次元ボックス座標を適応的に調整し, モデルトレーニングを正規化する。
不確実性の高い擬似bbox座標に対しては、比較的低い損失重みを割り当てる。
実験により、提案手法はノイズの多い擬似ボックスに対して堅牢であることが確認され、既存の手法と比較してnuScenesとLyftが大幅に改善され、AP$_{BEV}$が6.9%、AP$_{3D}$が2.5%、AP$_{BEV}$が2.2%、AP$_{3D}$が1.0%となった。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - Confidence-driven Bounding Box Localization for Small Object Detection [30.906712428887147]
信頼性駆動型バウンディングボックスローカライゼーション(C-BBL)法を提案する。
C-BBLは連続ラベルをグリッドに量子化し、2ホット基底の真理ラベルを定式化する。
異なるラベルシステムに対するC-BBLの一般化可能性と高分解能検出の有効性を示す。
論文 参考訳(メタデータ) (2023-03-03T09:19:08Z) - Uncertainty-Aware AB3DMOT by Variational 3D Object Detection [74.8441634948334]
不確実性推定は統計的に正確な予測を提供する効果的なツールである。
本稿では,変分ニューラルネットワークを用いたTANet 3Dオブジェクト検出器を提案し,不確実性のある3Dオブジェクト検出を行う。
論文 参考訳(メタデータ) (2023-02-12T14:30:03Z) - Exploring Active 3D Object Detection from a Generalization Perspective [58.597942380989245]
不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
論文 参考訳(メタデータ) (2023-01-23T02:43:03Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - Uncertainty-Aware Voxel based 3D Object Detection and Tracking with
von-Mises Loss [13.346392746224117]
不確実性は、認識システムのエラーに対処し、堅牢性を改善するのに役立ちます。
本稿では,SECOND検出器に不確実性レグレッションを追加することにより,目標追尾性能を向上させる手法を提案する。
論文 参考訳(メタデータ) (2020-11-04T21:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。