論文の概要: SVQNet: Sparse Voxel-Adjacent Query Network for 4D Spatio-Temporal LiDAR
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2308.13323v1
- Date: Fri, 25 Aug 2023 11:53:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-28 14:10:20.691023
- Title: SVQNet: Sparse Voxel-Adjacent Query Network for 4D Spatio-Temporal LiDAR
Semantic Segmentation
- Title(参考訳): SVQNet: Sparse Voxel-Adjacent Query Network for 4D Spatio-Temporal LiDAR Semantic Segmentation
- Authors: Xuechao Chen, Shuangjie Xu, Xiaoyi Zou, Tongyi Cao, Dit-Yan Yeung, Lu
Fang
- Abstract要約: 4次元LiDARセマンティックセマンティックセグメンテーションのためのSparse-Adjacent Query Network (SVQNet)を提案する。
歴史的枠組みを高効率に活用するために、歴史的点を現在の点に関して2つのグループにまとめる。
我々のSVQNetは、SemanticKITTIベンチマークとnuScenesデータセットのLiDARセマンティックセマンティックセマンティックセマンティックセマンティックセマンティクスにおいて、最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 36.06109780168387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LiDAR-based semantic perception tasks are critical yet challenging for
autonomous driving. Due to the motion of objects and static/dynamic occlusion,
temporal information plays an essential role in reinforcing perception by
enhancing and completing single-frame knowledge. Previous approaches either
directly stack historical frames to the current frame or build a 4D
spatio-temporal neighborhood using KNN, which duplicates computation and
hinders realtime performance. Based on our observation that stacking all the
historical points would damage performance due to a large amount of redundant
and misleading information, we propose the Sparse Voxel-Adjacent Query Network
(SVQNet) for 4D LiDAR semantic segmentation. To take full advantage of the
historical frames high-efficiently, we shunt the historical points into two
groups with reference to the current points. One is the Voxel-Adjacent
Neighborhood carrying local enhancing knowledge. The other is the Historical
Context completing the global knowledge. Then we propose new modules to select
and extract the instructive features from the two groups. Our SVQNet achieves
state-of-the-art performance in LiDAR semantic segmentation of the
SemanticKITTI benchmark and the nuScenes dataset.
- Abstract(参考訳): LiDARベースのセマンティック認識タスクは、自律運転には不可欠だが難しい。
物体の動きと静的・動的咬合により、時間情報は1つのフレーム知識の強化と完成によって知覚の強化に必須の役割を果たす。
従来のアプローチでは、過去のフレームを現在のフレームに直接スタックするか、KNNを使って4次元の時空間近傍を構築していた。
歴史的点の積み重ねが冗長で誤解を招く情報によって性能を損なうという観測に基づいて、4次元LiDARセマンティックセマンティックセマンティックセグメンテーションのためのSparse Voxel-Adjacent Query Network (SVQNet)を提案する。
歴史的枠組みを高効率に活用するために、歴史的点を現在の点に関して2つのグループにまとめる。
一つはVoxel-Adjacent Neighborhood(ヴォクセル・アドジャセント地区)で、地元の強化知識を持っている。
もう1つは、世界的知識を完成させる歴史的文脈である。
次に,2つのグループから命令的特徴を抽出・抽出する新しいモジュールを提案する。
私たちのsvqnetはsemantickittiベンチマークとnuscenesデータセットのlidarセマンティクスセグメンテーションにおいて最先端のパフォーマンスを実現しています。
関連論文リスト
- Hierarchical Temporal Context Learning for Camera-based Semantic Scene Completion [57.232688209606515]
カメラによるセマンティックシーンの補完を改善するための,新たな時間的文脈学習パラダイムであるHTCLを提案する。
提案手法は,Semantic KITTIベンチマークで1st$をランク付けし,mIoUの点でLiDARベースの手法を超えている。
論文 参考訳(メタデータ) (2024-07-02T09:11:17Z) - LiDAR-based 4D Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,両タスクの現在の最先端手法よりも優れた精度を実現する。
DS-Netを4次元パノプティカルLiDARセグメンテーションに拡張し、一列のLiDARフレーム上で時間的に統一されたインスタンスクラスタリングを行う。
論文 参考訳(メタデータ) (2022-03-14T15:25:42Z) - LiDAR-based Recurrent 3D Semantic Segmentation with Temporal Memory
Alignment [0.0]
本稿では,単一範囲の画像フレームを入力とする再帰セグメンテーションアーキテクチャ(RNN)を提案する。
私たちがテンポラルメモリアライメントと呼ぶアライメント戦略は、エゴモーションを使用して、フィーチャースペース内の連続フレーム間のメモリをテンポラリアライメントします。
2つの大規模データセットに対する提案手法の利点を実証し,いくつかの最先端手法と比較する。
論文 参考訳(メタデータ) (2021-03-03T09:01:45Z) - Spatiotemporal Graph Neural Network based Mask Reconstruction for Video
Object Segmentation [70.97625552643493]
本稿では,クラス非依存オブジェクトを半教師あり設定でセグメント化するタスクについて述べる。
提案手法のすべてを利用して局所的なコンテキストを捕捉する新しいグラフニューラルネットワーク(TG-Net)を提案する。
論文 参考訳(メタデータ) (2020-12-10T07:57:44Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。