論文の概要: Accelerating Sparse Convolutions in Voxel-Based Point Cloud Networks
- arxiv url: http://arxiv.org/abs/2511.20834v1
- Date: Tue, 25 Nov 2025 20:34:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:58.85095
- Title: Accelerating Sparse Convolutions in Voxel-Based Point Cloud Networks
- Title(参考訳): Voxelベースのポイントクラウドネットワークにおけるスパース畳み込みの高速化
- Authors: Dionysios Adamopoulos, Anastasia Poulopoulou, Georgios Goumas, Christina Giannoula,
- Abstract要約: Sparse Convolutionは、自動運転やAR/VRで広く使われている3Dポイントのクラウドネットワークを利用している。
SpCは入力されたボクセル座標、出力座標、ウェイトオフセット間のマッピングを格納するカーネルマップを構築し、次にこのマップを使用して特徴ベクトルを出力座標に計算する。
我々の研究はボクセル座標の3つの重要な性質を同定する:それらは整数値であり、限られた空間範囲内で有界であり、同じ物体表面上の幾何学的に連続するボクセルは互いに小さな空間オフセットに存在する可能性が高い。
私たちは最初のボクセルプロパタイアウェア、Spiraを設計しました
- 参考スコア(独自算出の注目度): 0.34304285205574886
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sparse Convolution (SpC) powers 3D point cloud networks widely used in autonomous driving and AR/VR. SpC builds a kernel map that stores mappings between input voxel coordinates, output coordinates, and weight offsets, then uses this map to compute feature vectors for output coordinates. Our work identifies three key properties of voxel coordinates: they are integer-valued, bounded within a limited spatial range, and geometrically continuous-neighboring voxels on the same object surface are highly likely to exist at small spatial offsets from each other. Prior SpC engines do not fully exploit these properties and suffer from high pre-processing and post-processing overheads during kernel map construction. To address this, we design Spira, the first voxel-property-aware SpC engine for GPUs. Spira proposes: (i) a high-performance one-shot search algorithm that builds the kernel map with no preprocessing and high memory locality, (ii) an effective packed-native processing scheme that accesses packed voxel coordinates at low cost, (iii) a flexible dual-dataflow execution mechanism that efficiently computes output feature vectors by adapting to layer characteristics, and (iv) a network-wide parallelization strategy that builds kernel maps for all SpC layers concurrently at network start. Our evaluation shows that Spira significantly outperforms prior SpC engines by 1.71x on average and up to 2.31x for end-to-end inference, and by 2.13x on average and up to 3.32x for layer-wise execution across diverse layer configurations.
- Abstract(参考訳): スパース・コンボリューション(SpC)は、自律運転やAR/VRで広く使われている3Dポイント・クラウドネットワークを駆動する。
SpCは入力されたボクセル座標、出力座標、ウェイトオフセット間のマッピングを格納するカーネルマップを構築し、次にこのマップを使用して特徴ベクトルを出力座標に計算する。
我々の研究はボクセル座標の3つの重要な性質を同定する:それらは整数値であり、限られた空間範囲内で有界であり、同じ物体表面上の幾何学的に連続するボクセルは互いに小さな空間オフセットに存在する可能性が高い。
以前のSpCエンジンはこれらの特性を完全に活用せず、カーネルマップ構築時に高い前処理と後処理のオーバーヘッドに悩まされていた。
これを解決するために、GPU用の最初のボクセルプロパタイアのSpCエンジンであるSpiraを設計する。
Spiraは次のように提案している。
(i)前処理やメモリローカリティのないカーネルマップを構築する高性能なワンショット検索アルゴリズム。
(ii) 組込みボクセル座標を低コストでアクセスする効率的な組込みネイティブ処理方式。
三 層特性に適応して出力特徴ベクトルを効率的に計算する柔軟な二重データフロー実行機構
(iv)ネットワーク開始時に,すべてのSpCレイヤのカーネルマップを並列に構築する,ネットワーク全体の並列化戦略。
評価の結果,Spiraは従来のSpCエンジンを平均1.71倍,エンドツーエンド推論では最大2.31倍,多層構成では平均2.13倍,レイヤワイド実行では最大3.32倍に向上した。
関連論文リスト
- HARP-NeXt: High-Speed and Accurate Range-Point Fusion Network for 3D LiDAR Semantic Segmentation [39.58684038370709]
LiDARセマンティックセグメンテーションは、自動運転車や移動ロボットにとって不可欠である。
従来の最先端の手法は、精度とスピードのトレードオフに直面していることが多い。
本稿では,高速かつ高精度なLiDARセマンティックセグメンテーションネットワークであるHARP-NeXtを紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:46:07Z) - Ev-Edge: Efficient Execution of Event-based Vision Algorithms on Commodity Edge Platforms [10.104371980353973]
Ev-Edgeは、エッジプラットフォーム上でのイベントベースのビジョンシステムのパフォーマンスを高めるために、3つの重要な最適化を含むフレームワークである。
様々な自律ナビゲーションタスクのための最先端ネットワークでは、Ev-Edgeはレイテンシが1.28x-2.05x改善され、エネルギーが1.23x-2.15xになった。
論文 参考訳(メタデータ) (2024-03-23T04:44:55Z) - Minuet: Accelerating 3D Sparse Convolutions on GPUs [9.54287796030519]
スパース・コンボリューション(SC)は、本質的にスパースである3Dポイント・クラウドの処理に広く用いられている。
本研究では,従来の最先端のSCエンジンの欠点を分析し,最新のGPUに適した新しいメモリ効率のSCエンジンであるMinuetを提案する。
私たちの評価では、エンド・ツー・エンドのクラウド・ネットワークの実行に対して平均1.74時間(最大22.22時間)で、Minuetは以前のSCエンジンよりも大幅にパフォーマンスが向上している。
論文 参考訳(メタデータ) (2023-12-01T05:09:02Z) - PointOcc: Cylindrical Tri-Perspective View for Point-based 3D Semantic
Occupancy Prediction [72.75478398447396]
本稿では,点雲を効果的かつ包括的に表現する円筒型三重対視図を提案する。
また,LiDAR点雲の距離分布を考慮し,円筒座標系における三点ビューを構築した。
プロジェクション中に構造の詳細を維持するために空間群プーリングを使用し、各TPV平面を効率的に処理するために2次元バックボーンを採用する。
論文 参考訳(メタデータ) (2023-08-31T17:57:17Z) - Voxel or Pillar: Exploring Efficient Point Cloud Representation for 3D
Object Detection [49.324070632356296]
我々は3次元および2次元のスパース畳み込みにより点雲をボクセルと柱の特徴に符号化するスパース・ボクセル・ピラーエンコーダを開発した。
我々の効率的で完全なスパース法は、密度検出器とスパース検出器の両方にシームレスに統合できる。
論文 参考訳(メタデータ) (2023-04-06T05:00:58Z) - DSVT: Dynamic Sparse Voxel Transformer with Rotated Sets [95.84755169585492]
本研究では,屋外3次元知覚のためのシングルストライドウィンドウベースのボクセルトランスであるDynamic Sparse Voxel Transformer (DSVT)を提案する。
本モデルでは,3次元認識タスクを多岐にわたって行うことにより,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-01-15T09:31:58Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - Composite Convolution: a Flexible Operator for Deep Learning on 3D Point Clouds [4.104847990024176]
本稿では,3次元点雲を処理する既存の畳み込み演算子に代わる,柔軟で汎用的な複合層について紹介する。
ConvPointやKPConvのような主流のポイント・コンボリューション・レイヤと比較して、我々のコンポジット・レイヤはネットワーク設計の柔軟性を保証し、さらなる正規化の形式を提供します。
合成および実世界のデータセットを用いた実験により,分類,セグメンテーション,異常検出の両面で,当社のCompositeNetsは,同じシーケンシャルアーキテクチャを用いたConvPointより優れており,より深い残差アーキテクチャを持つKPConvと同じような結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-09-23T18:32:18Z) - PV-RCNN++: Point-Voxel Feature Set Abstraction With Local Vector
Representation for 3D Object Detection [100.60209139039472]
点雲からの正確な3次元検出を行うために,PointVoxel Region based Convolution Neural Networks (PVRCNNs)を提案する。
提案するPV-RCNNは,Openデータセットと高競争性KITTIベンチマークの両方において,従来の最先端3D検出方法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2021-01-31T14:51:49Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。