論文の概要: PDM-SSD: Single-Stage Three-Dimensional Object Detector With Point Dilation
- arxiv url: http://arxiv.org/abs/2502.07822v1
- Date: Mon, 10 Feb 2025 12:41:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-13 13:50:01.565583
- Title: PDM-SSD: Single-Stage Three-Dimensional Object Detector With Point Dilation
- Title(参考訳): PDM-SSD:ポイントディレーション付き1段3次元物体検出器
- Authors: Ao Liang, Haiyang Hua, Jian Fang, Wenyu Chen, Huaici Zhao,
- Abstract要約: 現在のポイントベースの検出器は、提供されたポイントからしか学べない。
単段3次元検出のための新しい点拡散機構(PDM-SSD)を提案する。
PDM-SSDは,68フレームの推論速度を持つ単一モード法において,マルチクラス検出の最先端性を実現する。
- 参考スコア(独自算出の注目度): 7.113034810057012
- License:
- Abstract: Current Point-based detectors can only learn from the provided points, with limited receptive fields and insufficient global learning capabilities for such targets. In this paper, we present a novel Point Dilation Mechanism for single-stage 3D detection (PDM-SSD) that takes advantage of these two representations. Specifically, we first use a PointNet-style 3D backbone for efficient feature encoding. Then, a neck with Point Dilation Mechanism (PDM) is used to expand the feature space, which involves two key steps: point dilation and feature filling. The former expands points to a certain size grid centered around the sampled points in Euclidean space. The latter fills the unoccupied grid with feature for backpropagation using spherical harmonic coefficients and Gaussian density function in terms of direction and scale. Next, we associate multiple dilation centers and fuse coefficients to obtain sparse grid features through height compression. Finally, we design a hybrid detection head for joint learning, where on one hand, the scene heatmap is predicted to complement the voting point set for improved detection accuracy, and on the other hand, the target probability of detected boxes are calibrated through feature fusion. On the challenging Karlsruhe Institute of Technology and Toyota Technological Institute (KITTI) dataset, PDM-SSD achieves state-of-the-art results for multi-class detection among single-modal methods with an inference speed of 68 frames. We also demonstrate the advantages of PDM-SSD in detecting sparse and incomplete objects through numerous object-level instances. Additionally, PDM can serve as an auxiliary network to establish a connection between sampling points and object centers, thereby improving the accuracy of the model without sacrificing inference speed. Our code will be available at https://github.com/AlanLiangC/PDM-SSD.git.
- Abstract(参考訳): 現在のポイントベースの検出器は提供されたポイントからしか学べず、受容場は限られており、そのようなターゲットに対するグローバルな学習能力は不十分である。
本稿では,この2つの表現を活かしたPDM-SSDのための新しいポイントダイレレーション機構を提案する。
具体的には、まずPointNetスタイルの3Dバックボーンを効率的な特徴符号化に使用します。
次に、PDM(Point Dilation Mechanism)を備えたネックを用いて特徴空間を拡大する。
前者はユークリッド空間のサンプル点を中心にある大きさの格子に点を広げる。
後者は、球面調和係数とガウス密度関数を方向とスケールで用いたバックプロパゲーション機能を備えた非占有格子を埋める。
次に,複数の拡張中心とヒューズ係数を関連付け,高さ圧縮によりスパースグリッド特性を得る。
最後に,共同学習のためのハイブリッド検出ヘッドを設計する。一方,シーンヒートマップは,検出精度を向上させるために設定された投票点を補完するものであり,一方,検出されたボックスのターゲット確率は特徴融合により調整される。
カールスルーエ工科大学とトヨタ技術研究所(KITTI)のデータセットに挑戦する上で、PDM-SSDは68フレームの推論速度を持つ単一モード法において、最先端のマルチクラス検出結果を達成する。
また,多数のオブジェクトレベルのインスタンスを通じてスパースや不完全なオブジェクトを検出する上で,PDM-SSDの利点を示す。
さらに、PDMはサンプリングポイントとオブジェクトセンターの接続を確立する補助ネットワークとして機能し、推論速度を犠牲にすることなくモデルの精度を向上させることができる。
私たちのコードはhttps://github.com/AlanLiangC/PDM-SSD.gitで公開されます。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - 3D-SPS: Single-Stage 3D Visual Grounding via Referred Point Progressive
Selection [35.5386998382886]
3Dビジュアルグラウンドは、自由形式の言語記述に従って、3Dポイントクラウドシーンで参照対象物を見つけることを目的としている。
従来の手法は主に2段階のパラダイム、すなわち言語非関連検出とクロスモーダルマッチングに従う。
本稿では,言語指導を用いてキーポイントを段階的に選択し,ターゲットを直接特定する3Dシングルステージ参照ポイントプログレッシブ選択法を提案する。
論文 参考訳(メタデータ) (2022-04-13T09:46:27Z) - Not All Points Are Equal: Learning Highly Efficient Point-based
Detectors for 3D LiDAR Point Clouds [29.762645632148097]
IA-SSDと呼ばれる高効率単段点ベース3D検出器を提案する。
学習可能な,タスク指向の,インスタンス対応の2つのダウンサンプリング戦略を利用して,前景点を階層的に選択する。
いくつかの大規模検出ベンチマークで行った実験は、IA-SSDの競合性能を示している。
論文 参考訳(メタデータ) (2022-03-21T17:14:02Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - 3D Object Detection Combining Semantic and Geometric Features from Point
Clouds [19.127930862527666]
そこで本研究では,SGNetと呼ばれる2次元物体検出装置を提案する。
VTPMはVoxel-Point-Based Moduleであり、最終的に点空間で3Dオブジェクト検出を実装している。
2021年9月19日時点で、KITTIデータセットでは、SGNetは、難易度の高いサイクリストの3DおよびBEV検出で1位、適度なサイクリストの3D検出では2位であった。
論文 参考訳(メタデータ) (2021-10-10T04:43:27Z) - MBDF-Net: Multi-Branch Deep Fusion Network for 3D Object Detection [17.295359521427073]
3次元物体検出のためのMulti-Branch Deep Fusion Network (MBDF-Net)を提案する。
最初の段階では、マルチブランチ機能抽出ネットワークは、Adaptive Attention Fusionモジュールを使用して、単一モーダルなセマンティックな特徴からクロスモーダルな融合機能を生成する。
第2段階では、関心領域(RoI)をプールした核融合モジュールを用いて局所的な特徴を改良する。
論文 参考訳(メタデータ) (2021-08-29T15:40:15Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - Cross-Modality 3D Object Detection [63.29935886648709]
本稿では,3次元物体検出のための新しい2段階多モード融合ネットワークを提案する。
アーキテクチャ全体が2段階の融合を促進する。
KITTIデータセットを用いた実験により,提案したマルチステージ融合により,ネットワークがより良い表現を学習できることが示唆された。
論文 参考訳(メタデータ) (2020-08-16T11:01:20Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。