論文の概要: DiffuBox: Refining 3D Object Detection with Point Diffusion
- arxiv url: http://arxiv.org/abs/2405.16034v2
- Date: Sat, 07 Dec 2024 00:25:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:49:15.237399
- Title: DiffuBox: Refining 3D Object Detection with Point Diffusion
- Title(参考訳): DiffuBox:ポイント拡散による3Dオブジェクト検出の精細化
- Authors: Xiangyu Chen, Zhenzhen Liu, Katie Z Luo, Siddhartha Datta, Adhitya Polavaram, Yan Wang, Yurong You, Boyi Li, Marco Pavone, Wei-Lun Chao, Mark Campbell, Bharath Hariharan, Kilian Q. Weinberger,
- Abstract要約: 本研究では,3次元物体の検出と局所化を確保するために,新しい拡散型ボックス精細化手法を提案する。
この方法は、粗いバウンディングボックスを囲むLiDAR点に条件付きドメインに依存しない拡散モデルを用いて、ボックスの位置、サイズ、方向を同時に洗練する。
結果から,異なるデータセット,オブジェクトクラス,検出器間での大幅な改善が示された。
- 参考スコア(独自算出の注目度): 74.01759893280774
- License:
- Abstract: Ensuring robust 3D object detection and localization is crucial for many applications in robotics and autonomous driving. Recent models, however, face difficulties in maintaining high performance when applied to domains with differing sensor setups or geographic locations, often resulting in poor localization accuracy due to domain shift. To overcome this challenge, we introduce a novel diffusion-based box refinement approach. This method employs a domain-agnostic diffusion model, conditioned on the LiDAR points surrounding a coarse bounding box, to simultaneously refine the box's location, size, and orientation. We evaluate this approach under various domain adaptation settings, and our results reveal significant improvements across different datasets, object classes and detectors. Our PyTorch implementation is available at \href{https://github.com/cxy1997/DiffuBox}{https://github.com/cxy1997/DiffuBox}.
- Abstract(参考訳): 堅牢な3Dオブジェクトの検出とローカライゼーションは、ロボット工学や自律運転における多くのアプリケーションにとって不可欠である。
しかし、近年のモデルでは、センサーの設定や地理的位置が異なるドメインに適用した場合、高い性能を維持することが困難であり、ドメインシフトによるローカライゼーションの精度が低下することが多い。
この課題を克服するために,新しい拡散型ボックスリファインメント手法を提案する。
この方法は、粗いバウンディングボックスを囲むLiDAR点に条件付きドメインに依存しない拡散モデルを用いて、ボックスの位置、サイズ、方向を同時に洗練する。
提案手法は,様々なドメイン適応設定下で評価され,その結果から,異なるデータセット,オブジェクトクラス,検出器間での大幅な改善が示された。
私たちのPyTorchの実装は、 \href{https://github.com/cxy1997/DiffuBox}{https://github.com/cxy1997/DiffuBox}で利用可能です。
関連論文リスト
- Revisiting Cross-Domain Problem for LiDAR-based 3D Object Detection [5.149095033945412]
我々は最先端モデルのクロスドメイン性能を深く分析する。
ほとんどのモデルはトレーニングドメインに過度に適合し、それを他のドメインに直接適用することは困難である。
我々は、メソッドの精度レベルにおける過度な低下の中核的な問題を分析するために、サイドビューとフロントビューAPという、さらなる評価指標を提案する。
論文 参考訳(メタデータ) (2024-08-22T19:52:44Z) - Detect Closer Surfaces that can be Seen: New Modeling and Evaluation in Cross-domain 3D Object Detection [7.464834150824093]
本研究では,エゴ車両のセンサに近接する表面を検出する3次元物体検出モデルの能力を測定するための2つの指標を提案する。
また、学習可能な近接面にもっと焦点を合わせるために、EdgeHeadという改良ヘッドも提案しています。
論文 参考訳(メタデータ) (2024-07-04T17:06:16Z) - Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。
本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。
我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文 参考訳(メタデータ) (2024-03-20T12:51:30Z) - Source-Free and Image-Only Unsupervised Domain Adaptation for Category
Level Object Pose Estimation [18.011044932979143]
3DUDAは、3Dや深度データを使わずに、ニュアンスドライデンのターゲットドメインに適応できる手法である。
対象のカテゴリを単純な立方体メッシュとして表現し、ニューラル特徴活性化の生成モデルを利用する。
本手法は,グローバルな擬似ラベル付きデータセットの微調整を軽度な仮定でシミュレートする。
論文 参考訳(メタデータ) (2024-01-19T17:48:05Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z) - Density-Insensitive Unsupervised Domain Adaption on 3D Object Detection [19.703181080679176]
ポイントクラウドからの3Dオブジェクト検出は、安全クリティカルな自動運転において不可欠である。
本稿では,密度依存性ドメインギャップに対処する密度依存性ドメイン適応フレームワークを提案する。
3つの広く採用されている3次元オブジェクト検出データセットの実験結果から,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-04-19T06:33:07Z) - MS3D: Leveraging Multiple Detectors for Unsupervised Domain Adaptation
in 3D Object Detection [7.489722641968593]
マルチソース3D(MS3D)は、3Dオブジェクト検出における教師なしドメイン適応のための新しい自己学習パイプラインである。
提案するKernel-Density Estimation (KDE) Box Fusion法は,複数のドメインからのボックス提案を融合して擬似ラベルを得る。
MS3Dはドメインシフトに対してより堅牢性を示し、より大きな距離で正確な擬似ラベルを生成する。
論文 参考訳(メタデータ) (2023-04-05T13:29:21Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - ImpDet: Exploring Implicit Fields for 3D Object Detection [74.63774221984725]
我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文 参考訳(メタデータ) (2022-03-31T17:52:12Z) - Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation [62.29076080124199]
本稿では,クロスドメインオブジェクト検出のための特徴適応手法を提案する。
粗粒度では、アテンション機構を採用して前景領域を抽出し、その辺縁分布に応じて整列する。
粒度の細かい段階では、同じカテゴリのグローバルプロトタイプと異なるドメインとの距離を最小化することにより、前景の条件分布アライメントを行う。
論文 参考訳(メタデータ) (2020-03-23T13:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。