論文の概要: Online Segmentation of LiDAR Sequences: Dataset and Algorithm
- arxiv url: http://arxiv.org/abs/2206.08194v1
- Date: Thu, 16 Jun 2022 14:08:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-18 00:52:12.276797
- Title: Online Segmentation of LiDAR Sequences: Dataset and Algorithm
- Title(参考訳): LiDARシーケンスのオンラインセグメンテーション:データセットとアルゴリズム
- Authors: Romain Loiseau and Mathieu Aubry and Lo\"ic Landrieu
- Abstract要約: ルーフマウントの回転するLiDARセンサーは、自動運転車で広く使われている。
HelixNetは、詳細なラベル、タイムスタンプ、センサー回転情報を備えた100億ドルのポイントデータセットです。
第2に,LiDAR点列の回転に特化して設計された,コンパクトかつ効率的な変圧器時間構造Helix4Dを提案する。
- 参考スコア(独自算出の注目度): 20.451136463885867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Roof-mounted spinning LiDAR sensors are widely used by autonomous vehicles,
driving the need for real-time processing of 3D point sequences. However, most
LiDAR semantic segmentation datasets and algorithms split these acquisitions
into $360^\circ$ frames, leading to acquisition latency that is incompatible
with realistic real-time applications and evaluations. We address this issue
with two key contributions. First, we introduce HelixNet, a $10$ billion point
dataset with fine-grained labels, timestamps, and sensor rotation information
that allows an accurate assessment of real-time readiness of segmentation
algorithms. Second, we propose Helix4D, a compact and efficient spatio-temporal
transformer architecture specifically designed for rotating LiDAR point
sequences. Helix4D operates on acquisition slices that correspond to a fraction
of a full rotation of the sensor, significantly reducing the total latency. We
present an extensive benchmark of the performance and real-time readiness of
several state-of-the-art models on HelixNet and SemanticKITTI. Helix4D reaches
accuracy on par with the best segmentation algorithms with a reduction of more
than $5\times$ in terms of latency and $50\times$ in model size. Code and data
are available at: https://romainloiseau.fr/helixnet
- Abstract(参考訳): 回転するLiDARセンサーは自動運転車で広く使われており、3Dポイントシーケンスをリアルタイムに処理する必要がある。
しかし、ほとんどのLiDARセマンティックセグメンテーションデータセットとアルゴリズムは、これらの取得を360^\circ$フレームに分割し、現実的なリアルタイムアプリケーションや評価と互換性のない取得遅延をもたらす。
我々はこの問題を2つの重要な貢献で解決する。
まず,細粒度ラベル,タイムスタンプ,センサ回転情報を備えた10億ドルのポイントデータセットであるhelixnetを導入し,セグメンテーションアルゴリズムのリアルタイム即応性を正確に評価する。
次に,LiDAR点列の回転に特化して設計された,コンパクトかつ効率的な時空間トランスアーキテクチャHelix4Dを提案する。
Helix4Dは、センサーの完全な回転の分数に相当する取得スライスで動作し、全体の遅延を著しく低減する。
本稿では,HelixNet と SemanticKITTI 上での最先端モデルの性能とリアルタイム性に関する広範なベンチマークを示す。
Helix4Dの精度は最高のセグメンテーションアルゴリズムと同等で、レイテンシの面では5\times$以上、モデルサイズでは50\times$以上である。
コードとデータは、https://romainloiseau.fr/helixnetで入手できる。
関連論文リスト
- PointOcc: Cylindrical Tri-Perspective View for Point-based 3D Semantic
Occupancy Prediction [72.75478398447396]
本稿では,点雲を効果的かつ包括的に表現する円筒型三重対視図を提案する。
また,LiDAR点雲の距離分布を考慮し,円筒座標系における三点ビューを構築した。
プロジェクション中に構造の詳細を維持するために空間群プーリングを使用し、各TPV平面を効率的に処理するために2次元バックボーンを採用する。
論文 参考訳(メタデータ) (2023-08-31T17:57:17Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Super Sparse 3D Object Detection [48.684300007948906]
LiDARベースの3Dオブジェクト検出は、自動運転における長距離認識にますます貢献する。
高速な長距離検出を実現するため,まずフルスパース物体検出器FSDを提案する。
FSD++は、連続するフレーム間の点変化を示す残差点を生成する。
論文 参考訳(メタデータ) (2023-01-05T17:03:56Z) - MGTANet: Encoding Sequential LiDAR Points Using Long Short-Term
Motion-Guided Temporal Attention for 3D Object Detection [8.305942415868042]
ほとんどのLiDARセンサーは、リアルタイムで一連の点雲を生成する。
近年の研究では、一連の点集合に存在するコンテキストを活用することで、大幅な性能向上が達成されている。
複数の連続走査によって取得された点雲列を符号化する新しい3Dオブジェクト検出アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-12-01T11:24:47Z) - Hyperbolic Cosine Transformer for LiDAR 3D Object Detection [6.2216654973540795]
我々は,LiDAR点雲から3次元物体を検出するための2段階双曲型コサイントランス (ChTR3D) を提案する。
提案したChTR3Dは、線形複雑性におけるコッシュアテンションを適用して、点間のリッチな文脈関係を符号化することで、提案を洗練する。
広く使用されているKITTIデータセットの実験では、バニラアテンションと比較して、コッシュアテンションは競合性能による推論速度を大幅に改善することが示された。
論文 参考訳(メタデータ) (2022-11-10T13:54:49Z) - Fully Sparse 3D Object Detection [57.05834683261658]
長距離LiDARオブジェクト検出のためのフルスパース3Dオブジェクト検出器(FSD)を構築した。
FSDは一般的なスパース・ボクセル・エンコーダと新しいスパース・インスタンス認識(SIR)モジュール上に構築されている。
SIRは、ポイントをインスタンスにグループ化することで、以前のポイントベースのメソッドでの待ち行列クエリを避ける。
論文 参考訳(メタデータ) (2022-07-20T17:01:33Z) - CPGNet: Cascade Point-Grid Fusion Network for Real-Time LiDAR Semantic
Segmentation [8.944151935020992]
本稿では,有効性と効率を両立するカスケードポイントグリッド融合ネットワーク(CPGNet)を提案する。
アンサンブルモデルやTTAのないCPGNetは最先端のRPVNetと同等だが、4.7倍高速である。
論文 参考訳(メタデータ) (2022-04-21T06:56:30Z) - LiDAR-based 4D Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,両タスクの現在の最先端手法よりも優れた精度を実現する。
DS-Netを4次元パノプティカルLiDARセグメンテーションに拡張し、一列のLiDARフレーム上で時間的に統一されたインスタンスクラスタリングを行う。
論文 参考訳(メタデータ) (2022-03-14T15:25:42Z) - SRH-Net: Stacked Recurrent Hourglass Network for Stereo Matching [33.66537830990198]
本研究では,3次元畳み込みフィルタで用いる4次元立方体体積を相違点方向の逐次コストマップに分解する。
新たなリカレントモジュールであるスタックド・リカレント・ホアーグラス(SRH)が,各コストマップの処理のために提案されている。
提案アーキテクチャはエンドツーエンドのパイプラインで実装され、パブリックデータセットで評価される。
論文 参考訳(メタデータ) (2021-05-25T00:10:56Z) - Rethinking Pseudo-LiDAR Representation [70.29791705160203]
我々は、より一般化され、擬似LiDARベースの3D検出器としてインスタンス化できるPatch-Netという画像ベースCNN検出器を提案する。
提案するPatchNetは,既存の擬似LiDARベースデータセットよりも優れています。
論文 参考訳(メタデータ) (2020-08-11T08:44:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。