論文の概要: RangeSeg: Range-Aware Real Time Segmentation of 3D LiDAR Point Clouds
- arxiv url: http://arxiv.org/abs/2205.01570v1
- Date: Mon, 2 May 2022 09:57:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-05 04:27:57.700567
- Title: RangeSeg: Range-Aware Real Time Segmentation of 3D LiDAR Point Clouds
- Title(参考訳): RangeSeg: 3次元LiDAR点雲のレンジ対応リアルタイムセグメンテーション
- Authors: Tzu-Hsuan Chen and Tian Sheuan Chang
- Abstract要約: 本稿では、異なるLiDARレーザビームの不均一領域分布の利点を生かし、レンジアウェア・インスタンスセグメンテーション・ネットワークであるレンジセグメンテーション・ネットワークを提案する。
KITTIデータセットの実験では、RangeSegは最先端のセマンティックセマンティックセグメンテーション手法よりも、大幅に高速化されている。
RangeSegパイプライン全体はNVIDIAtextsuperscripttextregistered JETSON AGX Xavierのリアルタイム要件を満たしている。
- 参考スコア(独自算出の注目度): 0.6119392435448721
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Semantic outdoor scene understanding based on 3D LiDAR point clouds is a
challenging task for autonomous driving due to the sparse and irregular data
structure. This paper takes advantages of the uneven range distribution of
different LiDAR laser beams to propose a range aware instance segmentation
network, RangeSeg. RangeSeg uses a shared encoder backbone with two range
dependent decoders. A heavy decoder only computes top of a range image where
the far and small objects locate to improve small object detection accuracy,
and a light decoder computes whole range image for low computational cost. The
results are further clustered by the DBSCAN method with a resolution weighted
distance function to get instance-level segmentation results. Experiments on
the KITTI dataset show that RangeSeg outperforms the state-of-the-art semantic
segmentation methods with enormous speedup and improves the instance-level
segmentation performance on small and far objects. The whole RangeSeg pipeline
meets the real time requirement on NVIDIA\textsuperscript{\textregistered}
JETSON AGX Xavier with 19 frames per second in average.
- Abstract(参考訳): 3次元LiDAR点雲に基づくセマンティック屋外シーン理解は、スパースで不規則なデータ構造のため、自律運転には難しい課題である。
本稿では、異なるLiDARレーザビームの不均一領域分布の利点を生かし、範囲認識型インスタンスセグメンテーションネットワークであるRangeSegを提案する。
rangesegは2つのレンジ依存デコーダを持つ共有エンコーダバックボーンを使用する。
重復号器は、遠小の物体が位置する範囲画像の頂点のみを演算して小さな物体検出精度を向上し、光復号器は計算コストの低い範囲画像全体を演算する。
結果はDBSCAN法によりさらにクラスタ化され、分解能重み付き距離関数によりインスタンスレベルのセグメンテーション結果が得られる。
KITTIデータセットの実験では、RangeSegは最先端のセマンティックセマンティックセマンティクス手法よりも大幅に高速化され、小型および極小オブジェクトでのインスタンスレベルのセマンティクス性能が向上している。
RangeSegパイプライン全体がNVIDIA\textsuperscript{\textregistered} JETSON AGX Xavierのリアルタイム要件を満たしている。
関連論文リスト
- DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [62.63481844384229]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文 参考訳(メタデータ) (2024-06-05T01:32:31Z) - UniSeg: A Unified Multi-Modal LiDAR Segmentation Network and the
OpenPCSeg Codebase [43.95911443801265]
We present an unified multi-modal LiDAR segmentation network, called UniSeg。
セグメンテーションとパノプティクスのセグメンテーションを同時に行う。
また、OpenPCSegは、最大かつ最も包括的な屋外LiDARセグメンテーションである。
論文 参考訳(メタデータ) (2023-09-11T16:00:22Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Rethinking Range View Representation for LiDAR Segmentation [66.73116059734788]
「多対一」マッピング、意味的不整合、形状変形は、射程射影からの効果的な学習に対する障害となる可能性がある。
RangeFormerは、ネットワークアーキテクチャ、データ拡張、後処理を含む新しい設計を含む、フルサイクルのフレームワークである。
比較対象のLiDARセマンティックスとパノプティックスセグメンテーションのベンチマークにおいて,初めてレンジビュー法が点,ボクセル,マルチビューフュージョンを越えられることを示す。
論文 参考訳(メタデータ) (2023-03-09T16:13:27Z) - Super Sparse 3D Object Detection [48.684300007948906]
LiDARベースの3Dオブジェクト検出は、自動運転における長距離認識にますます貢献する。
高速な長距離検出を実現するため,まずフルスパース物体検出器FSDを提案する。
FSD++は、連続するフレーム間の点変化を示す残差点を生成する。
論文 参考訳(メタデータ) (2023-01-05T17:03:56Z) - Fully Sparse 3D Object Detection [57.05834683261658]
長距離LiDARオブジェクト検出のためのフルスパース3Dオブジェクト検出器(FSD)を構築した。
FSDは一般的なスパース・ボクセル・エンコーダと新しいスパース・インスタンス認識(SIR)モジュール上に構築されている。
SIRは、ポイントをインスタンスにグループ化することで、以前のポイントベースのメソッドでの待ち行列クエリを避ける。
論文 参考訳(メタデータ) (2022-07-20T17:01:33Z) - Meta-RangeSeg: LiDAR Sequence Semantic Segmentation Using Multiple
Feature Aggregation [21.337629798133324]
メタランジセグと呼ばれるLiDAR配列のセマンティックセグメンテーションに対する新しいアプローチを提案する。
空間時間情報をキャプチャするために、新しい範囲残像表現を導入する。
マルチスケール機能を得るために、効率的なU-Netバックボーンが使用される。
論文 参考訳(メタデータ) (2022-02-27T14:46:13Z) - FIDNet: LiDAR Point Cloud Semantic Segmentation with Fully Interpolation
Decoding [5.599306291149907]
2次元球面領域画像上に点雲を投影すると、LiDARセマンティックセマンティックセマンティックセマンティクスがレンジ画像上の2次元セマンティクスタスクに変換される。
本稿では,新しいネットワーク構造と効率的な後処理ステップからなる投影型LiDARセマンティックセマンティックセマンティクスパイプラインを提案する。
我々のパイプラインは、40倍の2048$の解像度を持つプロジェクションベースのメソッドと、すべてのポイントワイズソリューションの中で、最高のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2021-09-08T17:20:09Z) - RangeDet:In Defense of Range View for LiDAR-based 3D Object Detection [48.76483606935675]
アンカーフリーの単段LiDARベースの3Dオブジェクト検出器であるRangeDetを提案する。
一般的に使用されるVoxelizedまたはBird's Eye View(BEV)表現と比較して、範囲ビュー表現はよりコンパクトで量子化エラーはありません。
私達の最もよいモデルは車/歩行者/サイクリストの72.9/75.9/65.8 3D APを達成します。
論文 参考訳(メタデータ) (2021-03-18T06:18:51Z) - Range Conditioned Dilated Convolutions for Scale Invariant 3D Object
Detection [41.59388513615775]
本稿では,LiDARデータをそのネイティブ表現(範囲画像)に直接処理する新しい3Dオブジェクト検出フレームワークを提案する。
2D畳み込みは、レンジ画像のコンパクト性から、シーンの高密度LiDARデータを効率的に処理することができる。
論文 参考訳(メタデータ) (2020-05-20T09:24:43Z) - 3D Object Detection From LiDAR Data Using Distance Dependent Feature
Extraction [7.04185696830272]
本研究は、LiDAR点雲の性質を遠距離で考慮し、3次元物体検出器の改良を提案する。
その結果、近距離および長距離オブジェクトのための個別ネットワークのトレーニングは、すべてのKITTIベンチマークの困難さに対するパフォーマンスを高めることが示された。
論文 参考訳(メタデータ) (2020-03-02T13:16:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。