論文の概要: BSH-Det3D: Improving 3D Object Detection with BEV Shape Heatmap
- arxiv url: http://arxiv.org/abs/2303.02000v1
- Date: Fri, 3 Mar 2023 15:13:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 14:29:48.227874
- Title: BSH-Det3D: Improving 3D Object Detection with BEV Shape Heatmap
- Title(参考訳): BSH-Det3D:BEV形状ヒートマップによる3次元物体検出の改善
- Authors: You Shen, Yunzhou Zhang, Yanmin Wu, Zhenyu Wang, Linghao Yang, Sonya
Coleman, Dermot Kerr
- Abstract要約: 我々は,BSH-Det3Dという新しいLiDARベースの3Dオブジェクト検出モデルを提案する。
鳥の視線から完全な形状を推定することにより、空間的特徴を高める効果的な方法を適用する。
KITTIベンチマークの実験は、精度と速度の観点から最先端(SOTA)性能を達成する。
- 参考スコア(独自算出の注目度): 10.060577111347152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The progress of LiDAR-based 3D object detection has significantly enhanced
developments in autonomous driving and robotics. However, due to the
limitations of LiDAR sensors, object shapes suffer from deterioration in
occluded and distant areas, which creates a fundamental challenge to 3D
perception. Existing methods estimate specific 3D shapes and achieve remarkable
performance. However, these methods rely on extensive computation and memory,
causing imbalances between accuracy and real-time performance. To tackle this
challenge, we propose a novel LiDAR-based 3D object detection model named
BSH-Det3D, which applies an effective way to enhance spatial features by
estimating complete shapes from a bird's eye view (BEV). Specifically, we
design the Pillar-based Shape Completion (PSC) module to predict the
probability of occupancy whether a pillar contains object shapes. The PSC
module generates a BEV shape heatmap for each scene. After integrating with
heatmaps, BSH-Det3D can provide additional information in shape deterioration
areas and generate high-quality 3D proposals. We also design an attention-based
densification fusion module (ADF) to adaptively associate the sparse features
with heatmaps and raw points. The ADF module integrates the advantages of
points and shapes knowledge with negligible overheads. Extensive experiments on
the KITTI benchmark achieve state-of-the-art (SOTA) performance in terms of
accuracy and speed, demonstrating the efficiency and flexibility of BSH-Det3D.
The source code is available on https://github.com/mystorm16/BSH-Det3D.
- Abstract(参考訳): LiDARに基づく3Dオブジェクト検出の進歩は、自律走行とロボット工学の発展を著しく促進した。
しかし、LiDARセンサーの限界により、物体の形状は隠蔽領域や遠方領域の劣化に悩まされ、3D知覚にとって根本的な課題となる。
既存の方法は、特定の3次元形状を推定し、優れた性能を達成する。
しかし、これらの手法は広範な計算とメモリに依存しており、精度とリアルタイム性能の不均衡を引き起こす。
この課題に対処するために,鳥の視線(BEV)から完全な形状を推定することにより空間的特徴を効果的に向上する,新しいLiDARベースの3次元物体検出モデルBSH-Det3Dを提案する。
具体的には,Pillar-based Shape Completion (PSC) モジュールを設計し,柱が物体形状を含むかどうかの占有確率を予測する。
PSCモジュールは、シーン毎にBEV形状のヒートマップを生成する。
熱マップの統合により,BSH-Det3Dは形状劣化領域に付加的な情報を提供し,高品質な3D提案を生成する。
また,スパース特徴と熱マップと生点を適応的に関連付けるために,注意ベースデンシフィケーション融合モジュール (ADF) を設計する。
ADFモジュールはポイントの利点を統合し、無視できるオーバーヘッドで知識を形作る。
KITTIベンチマークの大規模な実験は、精度と速度の観点から最先端(SOTA)性能を実現し、BSH-Det3Dの効率と柔軟性を実証した。
ソースコードはhttps://github.com/mystorm16/BSH-Det3Dで入手できる。
関連論文リスト
- STONE: A Submodular Optimization Framework for Active 3D Object Detection [20.54906045954377]
正確な3Dオブジェクト検出器をトレーニングするための鍵となる要件は、大量のLiDARベースのポイントクラウドデータが利用できることである。
本稿では,3次元物体検出装置のトレーニングにおけるラベル付けコストを大幅に削減する,統合されたアクティブな3次元物体検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-04T20:45:33Z) - VFMM3D: Releasing the Potential of Image by Vision Foundation Model for Monocular 3D Object Detection [80.62052650370416]
モノクル3Dオブジェクト検出は、自律運転やロボティクスなど、さまざまなアプリケーションにおいて重要な役割を担っている。
本稿では,VFMM3Dを提案する。VFMM3Dは,ビジョンファウンデーションモデル(VFM)の機能を利用して,単一ビュー画像を正確にLiDARポイントクラウド表現に変換する,革新的なフレームワークである。
論文 参考訳(メタデータ) (2024-04-15T03:12:12Z) - Robust 3D Tracking with Quality-Aware Shape Completion [67.9748164949519]
そこで本研究では,高密度および完全点の雲からなる合成対象表現について,ロバストな3次元追跡のための形状完備化により正確に表現する。
具体的には, 形状が整ったボキセル化3次元追跡フレームワークを設計し, ノイズのある歴史的予測の悪影響を軽減するために, 品質に配慮した形状完備化機構を提案する。
論文 参考訳(メタデータ) (2023-12-17T04:50:24Z) - SOGDet: Semantic-Occupancy Guided Multi-view 3D Object Detection [19.75965521357068]
本稿では,SOGDet(Semantic-Occupancy Guided Multi-view Object Detection)と呼ばれる新しい手法を提案する。
以上の結果から,SOGDet は nuScenes Detection Score (NDS) と平均平均精度 (mAP) の3つのベースライン法の性能を一貫して向上させることがわかった。
これは、3Dオブジェクト検出と3Dセマンティック占有の組み合わせが、3D環境をより包括的に認識し、より堅牢な自律運転システムの構築を支援することを示唆している。
論文 参考訳(メタデータ) (2023-08-26T07:38:21Z) - BEV-IO: Enhancing Bird's-Eye-View 3D Detection with Instance Occupancy [58.92659367605442]
我々は,BEV表現をインスタンス占有情報で拡張する新しい3次元検出パラダイムであるBEV-IOを提案する。
BEV-IOは、パラメータや計算オーバーヘッドの無視できる増加しか加えず、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-26T11:16:12Z) - RBGNet: Ray-based Grouping for 3D Object Detection [104.98776095895641]
本稿では,点雲からの正確な3次元物体検出のための投票型3次元検出器RBGNetフレームワークを提案する。
決定された光線群を用いて物体表面上の点方向の特徴を集約する。
ScanNet V2 と SUN RGB-D による最先端の3D 検出性能を実現する。
論文 参考訳(メタデータ) (2022-04-05T14:42:57Z) - Improved Pillar with Fine-grained Feature for 3D Object Detection [23.348710029787068]
LiDAR点雲を用いた3次元物体検出は、自律走行知覚モジュールにおいて重要な役割を果たす。
既存の点ベースの手法は、生の点が多すぎるため、速度要件に到達するのが困難である。
PointPillarのような2Dグリッドベースの手法は、単純な2D畳み込みに基づいて、安定的で効率的な速度を容易に達成できる。
論文 参考訳(メタデータ) (2021-10-12T14:53:14Z) - Aug3D-RPN: Improving Monocular 3D Object Detection by Synthetic Images
with Virtual Depth [64.29043589521308]
仮想深度で画像を合成することでトレーニングデータを増強するレンダリングモジュールを提案する。
レンダリングモジュールは、RGB画像と対応するスパース深度画像とを入力として、さまざまなフォトリアリスティック合成画像を出力する。
さらに,深度推定タスクを通じて共同で最適化することで,検出モデルを改善する補助モジュールを導入する。
論文 参考訳(メタデータ) (2021-07-28T11:00:47Z) - HVPR: Hybrid Voxel-Point Representation for Single-stage 3D Object
Detection [39.64891219500416]
3Dオブジェクト検出手法は、シーン内の3Dオブジェクトを表現するために、ボクセルベースまたはポイントベースの特徴を利用する。
本稿では,voxelベースとポイントベースの両方の特徴を有する,新しい単段3次元検出手法を提案する。
論文 参考訳(メタデータ) (2021-04-02T06:34:49Z) - Accurate 3D Object Detection using Energy-Based Models [46.05502630457458]
スパースLiDARデータに基づく乱雑な環境における3Dバウンディングボックスの回帰は極めて難しい問題である。
確率回帰のための条件付きエネルギーベースモデル(EBM)の最近の進歩について検討する。
提案手法は,SA-SSDのベースラインを全3DODメトリクスで一貫して上回っている。
論文 参考訳(メタデータ) (2020-12-08T18:53:42Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。