論文の概要: DiffuBox: Refining 3D Object Detection with Point Diffusion
- arxiv url: http://arxiv.org/abs/2405.16034v2
- Date: Sat, 07 Dec 2024 00:25:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:49:15.237399
- Title: DiffuBox: Refining 3D Object Detection with Point Diffusion
- Title(参考訳): DiffuBox:ポイント拡散による3Dオブジェクト検出の精細化
- Authors: Xiangyu Chen, Zhenzhen Liu, Katie Z Luo, Siddhartha Datta, Adhitya Polavaram, Yan Wang, Yurong You, Boyi Li, Marco Pavone, Wei-Lun Chao, Mark Campbell, Bharath Hariharan, Kilian Q. Weinberger,
- Abstract要約: 本研究では,3次元物体の検出と局所化を確保するために,新しい拡散型ボックス精細化手法を提案する。
この方法は、粗いバウンディングボックスを囲むLiDAR点に条件付きドメインに依存しない拡散モデルを用いて、ボックスの位置、サイズ、方向を同時に洗練する。
結果から,異なるデータセット,オブジェクトクラス,検出器間での大幅な改善が示された。
- 参考スコア(独自算出の注目度): 74.01759893280774
- License:
- Abstract: Ensuring robust 3D object detection and localization is crucial for many applications in robotics and autonomous driving. Recent models, however, face difficulties in maintaining high performance when applied to domains with differing sensor setups or geographic locations, often resulting in poor localization accuracy due to domain shift. To overcome this challenge, we introduce a novel diffusion-based box refinement approach. This method employs a domain-agnostic diffusion model, conditioned on the LiDAR points surrounding a coarse bounding box, to simultaneously refine the box's location, size, and orientation. We evaluate this approach under various domain adaptation settings, and our results reveal significant improvements across different datasets, object classes and detectors. Our PyTorch implementation is available at \href{https://github.com/cxy1997/DiffuBox}{https://github.com/cxy1997/DiffuBox}.
- Abstract(参考訳): 堅牢な3Dオブジェクトの検出とローカライゼーションは、ロボット工学や自律運転における多くのアプリケーションにとって不可欠である。
しかし、近年のモデルでは、センサーの設定や地理的位置が異なるドメインに適用した場合、高い性能を維持することが困難であり、ドメインシフトによるローカライゼーションの精度が低下することが多い。
この課題を克服するために,新しい拡散型ボックスリファインメント手法を提案する。
この方法は、粗いバウンディングボックスを囲むLiDAR点に条件付きドメインに依存しない拡散モデルを用いて、ボックスの位置、サイズ、方向を同時に洗練する。
提案手法は,様々なドメイン適応設定下で評価され,その結果から,異なるデータセット,オブジェクトクラス,検出器間での大幅な改善が示された。
私たちのPyTorchの実装は、 \href{https://github.com/cxy1997/DiffuBox}{https://github.com/cxy1997/DiffuBox}で利用可能です。
関連論文リスト
- Revisiting Cross-Domain Problem for LiDAR-based 3D Object Detection [5.149095033945412]
我々は最先端モデルのクロスドメイン性能を深く分析する。
ほとんどのモデルはトレーニングドメインに過度に適合し、それを他のドメインに直接適用することは困難である。
我々は、メソッドの精度レベルにおける過度な低下の中核的な問題を分析するために、サイドビューとフロントビューAPという、さらなる評価指標を提案する。
論文 参考訳(メタデータ) (2024-08-22T19:52:44Z) - Detect Closer Surfaces that can be Seen: New Modeling and Evaluation in Cross-domain 3D Object Detection [7.464834150824093]
本研究では,エゴ車両のセンサに近接する表面を検出する3次元物体検出モデルの能力を測定するための2つの指標を提案する。
また、学習可能な近接面にもっと焦点を合わせるために、EdgeHeadという改良ヘッドも提案しています。
論文 参考訳(メタデータ) (2024-07-04T17:06:16Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z) - MS3D: Leveraging Multiple Detectors for Unsupervised Domain Adaptation
in 3D Object Detection [7.489722641968593]
マルチソース3D(MS3D)は、3Dオブジェクト検出における教師なしドメイン適応のための新しい自己学習パイプラインである。
提案するKernel-Density Estimation (KDE) Box Fusion法は,複数のドメインからのボックス提案を融合して擬似ラベルを得る。
MS3Dはドメインシフトに対してより堅牢性を示し、より大きな距離で正確な擬似ラベルを生成する。
論文 参考訳(メタデータ) (2023-04-05T13:29:21Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - An Unsupervised Domain Adaptive Approach for Multimodal 2D Object
Detection in Adverse Weather Conditions [5.217255784808035]
本稿では、ソースとターゲットドメイン間のドメインギャップを埋めるために、教師なしのドメイン適応フレームワークを提案する。
天候の歪みをシミュレートするデータ拡張方式を用いて、ドメインの混乱を増し、ソースデータへの過度な適合を防止する。
DENSEデータセットで行った実験は、我々の手法がドメインギャップを大幅に軽減できることを示している。
論文 参考訳(メタデータ) (2022-03-07T18:10:40Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation [62.29076080124199]
本稿では,クロスドメインオブジェクト検出のための特徴適応手法を提案する。
粗粒度では、アテンション機構を採用して前景領域を抽出し、その辺縁分布に応じて整列する。
粒度の細かい段階では、同じカテゴリのグローバルプロトタイプと異なるドメインとの距離を最小化することにより、前景の条件分布アライメントを行う。
論文 参考訳(メタデータ) (2020-03-23T13:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。