論文の概要: Harnessing Uncertainty-aware Bounding Boxes for Unsupervised 3D Object Detection
- arxiv url: http://arxiv.org/abs/2408.00619v2
- Date: Tue, 8 Oct 2024 14:13:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-08 13:29:21.875946
- Title: Harnessing Uncertainty-aware Bounding Boxes for Unsupervised 3D Object Detection
- Title(参考訳): 教師なし3次元物体検出のための不確かさを意識したバウンディングボックス
- Authors: Ruiyang Zhang, Hu Zhang, Hang Yu, Zhedong Zheng,
- Abstract要約: 教師なしの3Dオブジェクト検出は、LiDARポイントのようなラベル付けされていない生データから興味のあるオブジェクトを識別することを目的としている。
最近のアプローチでは、モデルトレーニングを初期化するためにクラスタリングアルゴリズムから擬似3Dバウンディングボックス(3D bbox)を採用するのが一般的である。
UA3Dと呼ばれる教師なし3Dオブジェクト検出のための新しい不確実性認識フレームワークを導入する。
- 参考スコア(独自算出の注目度): 22.297964850282177
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised 3D object detection aims to identify objects of interest from unlabeled raw data, such as LiDAR points. Recent approaches usually adopt pseudo 3D bounding boxes (3D bboxes) from clustering algorithm to initialize the model training. However, pseudo bboxes inevitably contain noise, and such inaccuracies accumulate to the final model, compromising the performance. Therefore, in an attempt to mitigate the negative impact of inaccurate pseudo bboxes, we introduce a new uncertainty-aware framework for unsupervised 3D object detection, dubbed UA3D. In particular, our method consists of two phases: uncertainty estimation and uncertainty regularization. (1) In the uncertainty estimation phase, we incorporate an extra auxiliary detection branch alongside the original primary detector. The prediction disparity between the primary and auxiliary detectors could reflect fine-grained uncertainty at the box coordinate level. (2) Based on the assessed uncertainty, we adaptively adjust the weight of every 3D bbox coordinate via uncertainty regularization, refining the training process on pseudo bboxes. For pseudo bbox coordinate with high uncertainty, we assign a relatively low loss weight. Extensive experiments verify that the proposed method is robust against the noisy pseudo bboxes, yielding substantial improvements on nuScenes and Lyft compared to existing approaches, with increases of +6.9% AP$_{BEV}$ and +2.5% AP$_{3D}$ on nuScenes, and +4.1% AP$_{BEV}$ and +2.0% AP$_{3D}$ on Lyft.
- Abstract(参考訳): 教師なしの3Dオブジェクト検出は、LiDARポイントのようなラベル付けされていない生データから興味のあるオブジェクトを識別することを目的としている。
最近のアプローチでは、モデルトレーニングを初期化するためにクラスタリングアルゴリズムから擬似3Dバウンディングボックス(3D bbox)を採用するのが一般的である。
しかし、疑似ボックスは必然的にノイズを含み、そのような不正確さは最終的なモデルに蓄積され、性能を損なう。
そこで, 不正確な擬似ボックスの負の影響を軽減するために, UA3Dと呼ばれる非教師なし3次元物体検出のための新しい不確実性認識フレームワークを導入する。
特に,本手法は不確実性推定と不確実性正則化の2段階からなる。
1) 不確実性推定フェーズでは、元の一次検出器と並行して追加の予備検出ブランチを組み込む。
一次検出器と補助検出器の差は、ボックス座標レベルでのきめ細かい不確かさを反映する可能性がある。
2) 評価した不確実性に基づいて, 不確実性正則化により各3次元bbox座標の重みを適応的に調整し, 擬似bbox上でのトレーニングプロセスを精査する。
不確実性の高い擬似bbox座標に対しては、比較的低い損失重みを割り当てる。
大規模な実験により、提案手法はノイズの多い擬似ボックスに対して堅牢であることが確認され、既存のアプローチと比較して、 +6.9% AP$_{BEV}$と +2.5% AP$_{3D}$と +4.1% AP$_{BEV}$と +2.0% AP$_{3D}$がLyftに増加した。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - Confidence-driven Bounding Box Localization for Small Object Detection [30.906712428887147]
信頼性駆動型バウンディングボックスローカライゼーション(C-BBL)法を提案する。
C-BBLは連続ラベルをグリッドに量子化し、2ホット基底の真理ラベルを定式化する。
異なるラベルシステムに対するC-BBLの一般化可能性と高分解能検出の有効性を示す。
論文 参考訳(メタデータ) (2023-03-03T09:19:08Z) - Uncertainty-Aware AB3DMOT by Variational 3D Object Detection [74.8441634948334]
不確実性推定は統計的に正確な予測を提供する効果的なツールである。
本稿では,変分ニューラルネットワークを用いたTANet 3Dオブジェクト検出器を提案し,不確実性のある3Dオブジェクト検出を行う。
論文 参考訳(メタデータ) (2023-02-12T14:30:03Z) - Exploring Active 3D Object Detection from a Generalization Perspective [58.597942380989245]
不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
論文 参考訳(メタデータ) (2023-01-23T02:43:03Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - Uncertainty-Aware Voxel based 3D Object Detection and Tracking with
von-Mises Loss [13.346392746224117]
不確実性は、認識システムのエラーに対処し、堅牢性を改善するのに役立ちます。
本稿では,SECOND検出器に不確実性レグレッションを追加することにより,目標追尾性能を向上させる手法を提案する。
論文 参考訳(メタデータ) (2020-11-04T21:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。