論文の概要: DBQ-SSD: Dynamic Ball Query for Efficient 3D Object Detection
- arxiv url: http://arxiv.org/abs/2207.10909v2
- Date: Thu, 6 Apr 2023 13:19:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-07 18:00:38.881117
- Title: DBQ-SSD: Dynamic Ball Query for Efficient 3D Object Detection
- Title(参考訳): DBQ-SSD: 効率的な3Dオブジェクト検出のための動的ボールクエリ
- Authors: Jinrong Yang, Lin Song, Songtao Liu, Weixin Mao, Zeming Li, Xiaoping
Li, Hongbin Sun, Jian Sun, Nanning Zheng
- Abstract要約: 入力特徴に応じて入力点のサブセットを適応的に選択する動的ボールクエリ(DBQ)ネットワークを提案する。
最先端の3D検出器に組み込むことができ、エンドツーエンドで訓練することで、計算コストを大幅に削減することができる。
- 参考スコア(独自算出の注目度): 113.5418064456229
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many point-based 3D detectors adopt point-feature sampling strategies to drop
some points for efficient inference. These strategies are typically based on
fixed and handcrafted rules, making it difficult to handle complicated scenes.
Different from them, we propose a Dynamic Ball Query (DBQ) network to
adaptively select a subset of input points according to the input features, and
assign the feature transform with a suitable receptive field for each selected
point. It can be embedded into some state-of-the-art 3D detectors and trained
in an end-to-end manner, which significantly reduces the computational cost.
Extensive experiments demonstrate that our method can increase the inference
speed by 30%-100% on KITTI, Waymo, and ONCE datasets. Specifically, the
inference speed of our detector can reach 162 FPS on KITTI scene, and 30 FPS on
Waymo and ONCE scenes without performance degradation. Due to skipping the
redundant points, some evaluation metrics show significant improvements. Codes
will be released at https://github.com/yancie-yjr/DBQ-SSD.
- Abstract(参考訳): 多くの点ベースの3D検出器は、効率的な推論のためにいくつかの点を落とすために点特徴サンプリング戦略を採用している。
これらの戦略は一般に固定されたルールと手作りのルールに基づいており、複雑なシーンを扱うのが困難である。
これらと異なり、入力特徴に応じて入力点のサブセットを適応的に選択する動的ボールクエリ(DBQ)ネットワークを提案し、選択された各点に対して適切な受容場に特徴変換を割り当てる。
最先端の3d検出器に組み込み、エンドツーエンドでトレーニングすることで、計算コストを大幅に削減することができる。
KITTI,Waymo,ONCEデータセット上で,提案手法が推論速度を30%-100%向上できることを示す。
具体的には、検出器の推論速度はkittiシーンで162fps、waymoで30fps、性能劣化なしに一度のシーンで30fpsに達することができる。
冗長な点をスキップするため、いくつかの評価指標は大幅な改善を示している。
コードはhttps://github.com/yancie-yjr/DBQ-SSDでリリースされる。
関連論文リスト
- V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - 3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - 3D Video Object Detection with Learnable Object-Centric Global
Optimization [65.68977894460222]
対応性に基づく最適化は3次元シーン再構成の基盤となるが、3次元ビデオオブジェクト検出では研究されていない。
オブジェクト中心の時間対応学習と特徴量付きオブジェクトバンドル調整を備えた、エンドツーエンドで最適化可能なオブジェクト検出器であるBA-Detを提案する。
論文 参考訳(メタデータ) (2023-03-27T17:39:39Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - Not All Points Are Equal: Learning Highly Efficient Point-based
Detectors for 3D LiDAR Point Clouds [29.762645632148097]
IA-SSDと呼ばれる高効率単段点ベース3D検出器を提案する。
学習可能な,タスク指向の,インスタンス対応の2つのダウンサンプリング戦略を利用して,前景点を階層的に選択する。
いくつかの大規模検出ベンチマークで行った実験は、IA-SSDの競合性能を示している。
論文 参考訳(メタデータ) (2022-03-21T17:14:02Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。