論文の概要: Sparse Cross-scale Attention Network for Efficient LiDAR Panoptic
Segmentation
- arxiv url: http://arxiv.org/abs/2201.05972v1
- Date: Sun, 16 Jan 2022 05:34:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-22 07:29:50.204812
- Title: Sparse Cross-scale Attention Network for Efficient LiDAR Panoptic
Segmentation
- Title(参考訳): 効率的なLiDARパノプティブセグメンテーションのためのスパースクロススケールアテンションネットワーク
- Authors: Shuangjie Xu, Rui Wan, Maosheng Ye, Xiaoyi Zou, Tongyi Cao
- Abstract要約: マルチスケールのスパース機能とグローバルなボクセル符号化されたアテンションを整合させて、インスタンスコンテキストの長距離関係をキャプチャする、新しいスパース・クロススケールアテンション・ネットワークであるSCANを提案する。
表面凝集点に対して、SCANは、整列した特徴の空間性を維持するだけでなく、スパース畳み込みによってネットワークの量を減少させる、新しいスパースクラス非依存のインスタンスセントロイド表現を採用する。
- 参考スコア(独自算出の注目度): 12.61753274984776
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Two major challenges of 3D LiDAR Panoptic Segmentation (PS) are that point
clouds of an object are surface-aggregated and thus hard to model the
long-range dependency especially for large instances, and that objects are too
close to separate each other. Recent literature addresses these problems by
time-consuming grouping processes such as dual-clustering, mean-shift offsets,
etc., or by bird-eye-view (BEV) dense centroid representation that downplays
geometry. However, the long-range geometry relationship has not been
sufficiently modeled by local feature learning from the above methods. To this
end, we present SCAN, a novel sparse cross-scale attention network to first
align multi-scale sparse features with global voxel-encoded attention to
capture the long-range relationship of instance context, which can boost the
regression accuracy of the over-segmented large objects. For the
surface-aggregated points, SCAN adopts a novel sparse class-agnostic
representation of instance centroids, which can not only maintain the sparsity
of aligned features to solve the under-segmentation on small objects, but also
reduce the computation amount of the network through sparse convolution. Our
method outperforms previous methods by a large margin in the SemanticKITTI
dataset for the challenging 3D PS task, achieving 1st place with a real-time
inference speed.
- Abstract(参考訳): 3D LiDAR Panoptic Segmentation (PS) の2つの大きな課題は、オブジェクトの点雲が表面集約され、特に大きなインスタンスに対して長距離依存をモデル化することが困難であり、オブジェクトが互いに近すぎることである。
近年の文献では、これらの問題を2重クラスタリング、平均シフトオフセットなどの時間を要するグループ化プロセスや、幾何学を軽視する鳥眼ビュー(BEV)密度セントロイド表現によって解決している。
しかし, 長射程幾何学関係は, 上記の手法による局所的特徴学習では十分にモデル化されていない。
そこで本稿では,マルチスケールなスパース機能をグローバルvoxelエンコードした注意と整合させ,インスタンスコンテキストの長距離関係を捉えるための,新たなスパースクロススケールアテンションネットワークであるscanを提案する。
表面凝集点に対して、SCANはインスタンスセントロイドのスパースクラス非依存表現を採用しており、これは小さなオブジェクトのアンダーセグメンテーションを解決するために整列した特徴の空間を維持できるだけでなく、スパース畳み込みによるネットワークの計算量を削減することができる。
提案手法は,3次元PSタスクにおいて,SemanticKITTIデータセットの大きなマージンで従来の手法よりも優れ,リアルタイム推論速度で1位となる。
関連論文リスト
- Contrastive Lift: 3D Object Instance Segmentation by Slow-Fast
Contrastive Fusion [110.84357383258818]
本稿では,2次元セグメントを3次元に上げ,ニューラルネットワーク表現を用いて融合させる新しい手法を提案する。
このアプローチの中核は、高速なクラスタリング目的関数であり、多数のオブジェクトを持つシーンにスケーラブルで適しています。
我々のアプローチは、ScanNet、Hypersim、Replicaのデータセットからの挑戦的なシーンにおいて、最先端の状況よりも優れています。
論文 参考訳(メタデータ) (2023-06-07T17:57:45Z) - Spatial Pruned Sparse Convolution for Efficient 3D Object Detection [41.62839541489369]
3Dシーンは多数のバックグラウンドポイントによって支配されており、主に前景オブジェクトにフォーカスする必要がある検出タスクには冗長である。
本稿では,既存の3D CNNの主要なコンポーネントを分析し,データの冗長性を無視し,さらにダウンサンプリングプロセスでそれを増幅することにより,余分な計算オーバーヘッドと不要な計算オーバーヘッドを発生させる。
SPS-ConvとSPSS-ConvとSPRSの2つの変種を含む新しい畳み込み演算子を提案する。
論文 参考訳(メタデータ) (2022-09-28T16:19:06Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - DFC: Deep Feature Consistency for Robust Point Cloud Registration [0.4724825031148411]
複雑なアライメントシーンのための学習に基づくアライメントネットワークを提案する。
我々は,3DMatchデータセットとKITTIオドメトリデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2021-11-15T08:27:21Z) - CPSeg: Cluster-free Panoptic Segmentation of 3D LiDAR Point Clouds [2.891413712995641]
CPSegと呼ばれるLiDAR点雲のための新しいリアルタイム・エンド・エンド・エンド・パノプティクス・セグメンテーション・ネットワークを提案する。
CPSegは、共有エンコーダ、デュアルデコーダ、タスク認識アテンションモジュール(TAM)、クラスタフリーインスタンスセグメンテーションヘッドを備える。
論文 参考訳(メタデータ) (2021-11-02T16:44:06Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z) - Spatial Semantic Embedding Network: Fast 3D Instance Segmentation with
Deep Metric Learning [5.699350798684963]
ディープラーニングを用いた3次元インスタンスセグメンテーションのための,単純かつ効率的なアルゴリズムを提案する。
大規模シーンからの高レベルのインテリジェントなタスクに対して、3Dインスタンスセグメンテーションはオブジェクトの個々のインスタンスを認識する。
我々は,ScanNet 3D インスタンス分割ベンチマークにおいて,我々のアルゴリズムの最先端性能をAPスコアで示す。
論文 参考訳(メタデータ) (2020-07-07T02:17:44Z) - Generative Sparse Detection Networks for 3D Single-shot Object Detection [43.91336826079574]
3Dオブジェクト検出は、ロボット工学や拡張現実など多くの有望な分野に適用可能であるため、広く研究されている。
しかし、3Dデータのまばらな性質は、このタスクに固有の課題をもたらしている。
本稿では,完全畳み込み単一ショットスパース検出ネットワークであるGenerative Sparse Detection Network (GSDN)を提案する。
論文 参考訳(メタデータ) (2020-06-22T15:54:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。