論文の概要: Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2403.06166v1
- Date: Sun, 10 Mar 2024 10:36:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 07:15:52.174254
- Title: Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving
- Title(参考訳): 自律走行における効率的な3次元物体検出のためのクロスクラスタシフト
- Authors: Zhili Chen, Kien T. Pham, Maosheng Ye, Zhiqiang Shen, and Qifeng Chen
- Abstract要約: 本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
- 参考スコア(独自算出の注目度): 69.20604395205248
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new 3D point-based detector model, named Shift-SSD, for precise
3D object detection in autonomous driving. Traditional point-based 3D object
detectors often employ architectures that rely on a progressive downsampling of
points. While this method effectively reduces computational demands and
increases receptive fields, it will compromise the preservation of crucial
non-local information for accurate 3D object detection, especially in the
complex driving scenarios. To address this, we introduce an intriguing
Cross-Cluster Shifting operation to unleash the representation capacity of the
point-based detector by efficiently modeling longer-range inter-dependency
while including only a negligible overhead. Concretely, the Cross-Cluster
Shifting operation enhances the conventional design by shifting partial
channels from neighboring clusters, which enables richer interaction with
non-local regions and thus enlarges the receptive field of clusters. We conduct
extensive experiments on the KITTI, Waymo, and nuScenes datasets, and the
results demonstrate the state-of-the-art performance of Shift-SSD in both
detection accuracy and runtime efficiency.
- Abstract(参考訳): 自律運転における高精度3次元物体検出のための新しい3次元点検出モデルshift-ssdを提案する。
従来の3Dオブジェクト検出器では、ポイントの進行的なダウンサンプリングに依存するアーキテクチャを用いることが多い。
この手法は、計算要求を効果的に削減し、受容磁場を増加させるが、特に複雑な駆動シナリオにおいて、正確な3dオブジェクト検出のための重要な非局所情報の保存を損なう。
そこで本研究では,より長い距離の相互依存性を効率的にモデル化し,最小限のオーバーヘッドしか持たない点ベース検出器の表現能力を解き放つために,興味深いクロスクラスタシフト操作を導入する。
具体的には、クロスクラスタシフト操作は、近隣のクラスタから部分チャネルをシフトすることで従来の設計を強化し、非局所領域とのリッチな相互作用を可能にし、クラスタの受容領域を拡大する。
kitti,waymo,nuscenesデータセットについて広範な実験を行い,検出精度と実行効率の両方においてshift-ssdの最先端の性能を示す。
関連論文リスト
- Domain Generalization of 3D Object Detection by Density-Resampling [14.510085711178217]
ポイントクラウドベースの3Dオブジェクト検出は、新しいドメインギャップを持つデータに遭遇する際のパフォーマンス劣化に悩まされる。
対象領域に対する3次元物体検出の一般化性を向上させるためのSDG法を提案する。
本研究では,新しいデータ拡張手法を導入し,その方法論に新しいマルチタスク学習戦略を貢献する。
論文 参考訳(メタデータ) (2023-11-17T20:01:29Z) - LS-VOS: Identifying Outliers in 3D Object Detections Using Latent Space
Virtual Outlier Synthesis [10.920640666237833]
LiDARベースの3Dオブジェクト検出器は、自動運転アプリケーションにおいて前例のないスピードと精度を達成した。
それらはしばしば、信頼度の高い予測や、実際のオブジェクトが存在しないリターン検出に偏っている。
LS-VOSは,3次元物体検出における外れ値の同定を行うフレームワークである。
論文 参考訳(メタデータ) (2023-10-02T07:44:26Z) - SSC3OD: Sparsely Supervised Collaborative 3D Object Detection from LiDAR
Point Clouds [16.612824810651897]
疎密な協調3Dオブジェクト検出フレームワークSSC3ODを提案する。
各エージェントは、シーン内の1つのオブジェクトをランダムにラベルするだけです。
疎調整された3Dオブジェクト検出器の性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2023-07-03T02:42:14Z) - DETR4D: Direct Multi-View 3D Object Detection with Sparse Attention [50.11672196146829]
サラウンドビュー画像を用いた3次元物体検出は、自動運転にとって必須の課題である。
マルチビュー画像における3次元オブジェクト検出のためのスパースアテンションと直接特徴クエリを探索するトランスフォーマーベースのフレームワークであるDETR4Dを提案する。
論文 参考訳(メタデータ) (2022-12-15T14:18:47Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in
Driving Scenes [82.4186966781934]
Ret3Dと呼ばれるシンプルで効率的で効果的な2段階検出器を導入する。
Ret3Dの中核は、新しいフレーム内およびフレーム間関係モジュールの利用である。
無視できる余分なオーバーヘッドにより、Ret3Dは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-18T03:48:58Z) - High-level camera-LiDAR fusion for 3D object detection with machine
learning [0.0]
本稿では,自律運転などの応用において重要な3次元物体検出問題に取り組む。
モノクロカメラとLiDARデータを組み合わせた機械学習パイプラインを使用して、動くプラットフォームの周囲の3D空間内の車両を検出する。
本結果は,検証セットに対して効率よく精度の高い推定を行い,全体の精度は87.1%となった。
論文 参考訳(メタデータ) (2021-05-24T01:57:34Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。