論文の概要: Selectively Dilated Convolution for Accuracy-Preserving Sparse Pillar-based Embedded 3D Object Detection
- arxiv url: http://arxiv.org/abs/2408.13798v1
- Date: Sun, 25 Aug 2024 10:14:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 17:49:53.853732
- Title: Selectively Dilated Convolution for Accuracy-Preserving Sparse Pillar-based Embedded 3D Object Detection
- Title(参考訳): Sparse Pillar-based Embedded 3D Object Detection のための選択的拡張畳み込み
- Authors: Seongmin Park, Minjae Lee, Junwon Choi, Jungwook Choi,
- Abstract要約: 分散点雲データから導出される柱の固有空間を無視するため、高密度柱処理は計算を無駄にする。
我々は、符号化された柱の重要性を評価し、畳み込み出力を選択的に拡張する選択拡張(SD-Conv)畳み込みを提案する。
この設計はSD-Convをサポートし、領域とサイズに大きな需要がなく、スピードアップとモデルの精度のトレードオフが優れている。
- 参考スコア(独自算出の注目度): 15.661833433778147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pillar-based 3D object detection has gained traction in self-driving technology due to its speed and accuracy facilitated by the artificial densification of pillars for GPU-friendly processing. However, dense pillar processing fundamentally wastes computation since it ignores the inherent sparsity of pillars derived from scattered point cloud data. Motivated by recent embedded accelerators with native sparsity support, sparse pillar convolution methods like submanifold convolution (SubM-Conv) aimed to reduce these redundant computations by applying convolution only on active pillars but suffered considerable accuracy loss. Our research identifies that this accuracy loss is due to the restricted fine-grained spatial information flow (fSIF) of SubM-Conv in sparse pillar networks. To overcome this restriction, we propose a selectively dilated (SD-Conv) convolution that evaluates the importance of encoded pillars and selectively dilates the convolution output, enhancing the receptive field for critical pillars and improving object detection accuracy. To facilitate actual acceleration with this novel convolution approach, we designed SPADE+ as a cost-efficient augmentation to existing embedded sparse convolution accelerators. This design supports the SD-Conv without significant demands in area and SRAM size, realizing superior trade-off between the speedup and model accuracy. This strategic enhancement allows our method to achieve extreme pillar sparsity, leading to up to 18.1x computational savings and 16.2x speedup on the embedded accelerators, without compromising object detection accuracy.
- Abstract(参考訳): ピラーをベースとした3Dオブジェクト検出は、GPUフレンドリーな処理のための柱の人工的な密度化によって、そのスピードと精度により、自動運転技術で注目を集めている。
しかし,高密度の柱処理は分散点雲データから得られる柱の固有空間を無視するため,基本的に計算を無駄にしている。
最近の組込み加速器によるネイティブな疎結合支援により、サブマニフォールド畳み込み(SubM-Conv)のようなスパース柱畳み込み法は、アクティブな柱のみに畳み込みを施すことによって、これらの冗長な計算を減らすことを目的としていた。
本研究では, この精度損失は, スパース柱ネットワークにおけるSubM-Convの細粒度空間情報フロー(fSIF)の制限によるものであることを明らかにした。
この制限を克服するために、符号化された柱の重要性を評価し、畳み込み出力を選択的に拡張する選択拡張(SD-Conv)畳み込みを提案する。
この新たな畳み込みアプローチで実際の加速を容易にするため,既存の組込みスパース畳み込み加速器のコスト効率向上を目的としたSPADE+を設計した。
この設計はSD-Convをサポートし、領域とSRAMサイズに大きな需要がなく、スピードアップとモデルの精度のトレードオフが優れている。
この戦略的強化により,物体検出精度を損なうことなく,最大18.1倍の計算節約と16.2倍の高速化を実現することができる。
関連論文リスト
- ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - SPADE: Sparse Pillar-based 3D Object Detection Accelerator for
Autonomous Driving [18.745798346661097]
ポイントクラウド(PC)データを用いた3次元物体検出は、自律運転の知覚パイプラインに不可欠である。
広く採用されている鳥眼ビュー(BEV)エンコーディングであるPointPillarsは、高速で正確な3Dオブジェクト検出のために、3Dポイントクラウドデータを2Dピラーに集約する。
柱型3次元物体検出におけるベクトル空間の幅を最大化し,ベクトルスパース畳み込みを高速化するアルゴリズム・ハードウェア協調設計手法であるSPADEを提案する。
論文 参考訳(メタデータ) (2023-05-12T14:38:49Z) - An Efficient Convex Hull-based Vehicle Pose Estimation Method for 3D
LiDAR [1.9580473532948401]
自動運転車の認識技術において,LiDARを用いた車両の姿勢推定が不可欠である。
既存のポーズ推定手法を用いて3次元LiDARに基づく良好なポーズ抽出を実現することは困難である。
凸船体に基づく新しい車両のポーズ推定手法を提案する。
論文 参考訳(メタデータ) (2023-02-02T11:57:41Z) - 3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object
Detection on Edge for Intelligent Transportation System [28.55894241049706]
本稿では,ポイントクラウドに基づく不整合予測を緩和する3次元高調波損失関数を提案する。
提案手法はベンチマークモデルよりも性能が大幅に向上する。
私たちのコードはオープンソースで公開されています。
論文 参考訳(メタデータ) (2022-11-07T10:11:48Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Improved Pillar with Fine-grained Feature for 3D Object Detection [23.348710029787068]
LiDAR点雲を用いた3次元物体検出は、自律走行知覚モジュールにおいて重要な役割を果たす。
既存の点ベースの手法は、生の点が多すぎるため、速度要件に到達するのが困難である。
PointPillarのような2Dグリッドベースの手法は、単純な2D畳み込みに基づいて、安定的で効率的な速度を容易に達成できる。
論文 参考訳(メタデータ) (2021-10-12T14:53:14Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。