論文の概要: Rethinking Voxelization and Classification for 3D Object Detection
- arxiv url: http://arxiv.org/abs/2301.04058v1
- Date: Tue, 10 Jan 2023 16:22:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 16:27:36.421020
- Title: Rethinking Voxelization and Classification for 3D Object Detection
- Title(参考訳): 3次元物体検出のためのボクセル化と分類の再考
- Authors: Youshaa Murhij, Alexander Golodkov, Dmitry Yudin
- Abstract要約: LiDARポイントクラウドからの3Dオブジェクト検出の主な課題は、ネットワークの信頼性に影響を与えることなく、リアルタイムのパフォーマンスを実現することである。
本稿では,高速な動的ボキセラライザを実装することにより,ネットワークの推論速度と精度を同時に向上するソリューションを提案する。
さらに,予測対象を分類し,偽検出対象をフィルタリングする軽量検出サブヘッドモデルを提案する。
- 参考スコア(独自算出の注目度): 68.8204255655161
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The main challenge in 3D object detection from LiDAR point clouds is
achieving real-time performance without affecting the reliability of the
network. In other words, the detecting network must be confident enough about
its predictions. In this paper, we present a solution to improve network
inference speed and precision at the same time by implementing a fast dynamic
voxelizer that works on fast pillar-based models in the same way a voxelizer
works on slow voxel-based models. In addition, we propose a lightweight
detection sub-head model for classifying predicted objects and filter out false
detected objects that significantly improves model precision in a negligible
time and computing cost. The developed code is publicly available at:
https://github.com/YoushaaMurhij/RVCDet.
- Abstract(参考訳): LiDARポイントクラウドからの3Dオブジェクト検出の主な課題は、ネットワークの信頼性に影響を与えることなく、リアルタイムのパフォーマンスを実現することである。
言い換えれば、検出ネットワークはその予測に十分自信を持っていなければならない。
本稿では,voxelが遅いvoxelベースモデルで動作するのと同じように,高速なピラーベースモデルで動作する高速動的voxelizerを実装することにより,ネットワーク推論の速度と精度を両立させるソリューションを提案する。
さらに,予測対象の分類と誤検出対象のフィルタリングを行う軽量な検出サブヘッドモデルを提案する。
開発済みのコードは、https://github.com/YoushaaMurhij/RVCDet.comで公開されている。
関連論文リスト
- VALO: A Versatile Anytime Framework for LiDAR-based Object Detection Deep Neural Networks [4.953750672237398]
本研究は,LDARオブジェクト検出ディープニューラルネットワーク(DNN)における動的期限条件の適用という課題に対処する。
VALO(Versatile Anytime Algorithm for LiDAR Object Detection)は3次元LiDARオブジェクト検出DNNの任意の時間計算を可能にする新しいデータ中心のアプローチである。
本研究では,最先端の3次元LiDARオブジェクト検出ネットワーク,すなわちCenterPointとVoxelNextにVALOを実装し,その動的適応性を広範囲の時間制約に適用できることを実証する。
論文 参考訳(メタデータ) (2024-09-17T20:30:35Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z) - VoxelNeXt: Fully Sparse VoxelNet for 3D Object Detection and Tracking [78.25819070166351]
完全スパース3次元物体検出のためのVoxelNextを提案する。
私たちの中核となる洞察は、手作りのプロキシに頼ることなく、スパースボクセル機能に基づいてオブジェクトを直接予測することです。
私たちの強力なスパース畳み込みネットワークVoxelNeXtは、voxelの機能を通して3Dオブジェクトを検出し、追跡します。
論文 参考訳(メタデータ) (2023-03-20T17:40:44Z) - Anytime-Lidar: Deadline-aware 3D Object Detection [5.491655566898372]
スケジューリングアルゴリズムを提案する。このアルゴリズムは,コンポーネントのサブセットをインテリジェントに選択し,有効時間と高精度のトレードオフをオンザフライで行う。
我々は,最先端の3Dオブジェクト検出ネットワークであるPointPillarsにアプローチを適用し,Jetson Xavier AGXデータセットの性能評価を行った。
論文 参考訳(メタデータ) (2022-08-25T16:07:10Z) - 3DVerifier: Efficient Robustness Verification for 3D Point Cloud Models [17.487852393066458]
既存のポイントクラウドモデルの検証手法は,大規模ネットワーク上で時間的・計算的に実現不可能である。
本稿では,2つの問題に対処する3DVerifierを提案し,線形緩和関数を適用して乗算層を結合し,前方と後方の伝搬を結合する。
提案手法は,大規模ネットワークにおける検証効率のオーダー・オブ・マグニチュード向上を実現し,得られた認証境界も最先端の検証器よりもかなり厳密である。
論文 参考訳(メタデータ) (2022-07-15T15:31:16Z) - Paint and Distill: Boosting 3D Object Detection with Semantic Passing
Network [70.53093934205057]
ライダーやカメラセンサーからの3Dオブジェクト検出タスクは、自動運転に不可欠である。
本研究では,既存のライダーベース3D検出モデルの性能向上を図るために,SPNetという新しいセマンティックパスフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-12T12:35:34Z) - Lite-FPN for Keypoint-based Monocular 3D Object Detection [18.03406686769539]
keypointベースのモノクロ3dオブジェクト検出は、非常に進歩し、高い速度精度のトレードオフを達成した。
マルチスケール機能融合を実現する軽量機能ピラミッドネットワークLite-FPNを提案します。
提案手法は,高い精度とフレームレートを同時に達成する。
論文 参考訳(メタデータ) (2021-05-01T14:44:31Z) - Voxel R-CNN: Towards High Performance Voxel-based 3D Object Detection [99.16162624992424]
Voxel R-CNNというシンプルで効果的なVoxelベースのフレームワークを考案しました。
2段階のアプローチでボクセルの特徴をフル活用することにより,最先端の点ベースモデルと同等の精度で検出できる。
その結果、Voxel R-CNNは、NVIDIA 2080 Ti GPU上での25 FPSの速度で、リアルタイムフレーム処理速度を維持しながら、より高い検出精度を提供する。
論文 参考訳(メタデータ) (2020-12-31T17:02:46Z) - InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic
Information Modeling [65.47126868838836]
動的情報モデリングを用いた新しい3次元オブジェクト検出フレームワークを提案する。
粗い予測は、ボクセルベースの領域提案ネットワークを介して第1段階で生成される。
大規模なnuScenes 3D検出ベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-07-16T18:27:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。