Fugu-MT 論文翻訳(概要): Sparse Cross-scale Attention Network for Efficient LiDAR Panoptic Segmentation

論文の概要: Sparse Cross-scale Attention Network for Efficient LiDAR Panoptic Segmentation

arxiv url: http://arxiv.org/abs/2201.05972v1
Date: Sun, 16 Jan 2022 05:34:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-01-22 07:29:50.204812
Title: Sparse Cross-scale Attention Network for Efficient LiDAR Panoptic Segmentation
Title（参考訳）: 効率的なLiDARパノプティブセグメンテーションのためのスパースクロススケールアテンションネットワーク
Authors: Shuangjie Xu, Rui Wan, Maosheng Ye, Xiaoyi Zou, Tongyi Cao
Abstract要約: マルチスケールのスパース機能とグローバルなボクセル符号化されたアテンションを整合させて、インスタンスコンテキストの長距離関係をキャプチャする、新しいスパース・クロススケールアテンション・ネットワークであるSCANを提案する。表面凝集点に対して、SCANは、整列した特徴の空間性を維持するだけでなく、スパース畳み込みによってネットワークの量を減少させる、新しいスパースクラス非依存のインスタンスセントロイド表現を採用する。
参考スコア（独自算出の注目度）: 12.61753274984776
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Two major challenges of 3D LiDAR Panoptic Segmentation (PS) are that point clouds of an object are surface-aggregated and thus hard to model the long-range dependency especially for large instances, and that objects are too close to separate each other. Recent literature addresses these problems by time-consuming grouping processes such as dual-clustering, mean-shift offsets, etc., or by bird-eye-view (BEV) dense centroid representation that downplays geometry. However, the long-range geometry relationship has not been sufficiently modeled by local feature learning from the above methods. To this end, we present SCAN, a novel sparse cross-scale attention network to first align multi-scale sparse features with global voxel-encoded attention to capture the long-range relationship of instance context, which can boost the regression accuracy of the over-segmented large objects. For the surface-aggregated points, SCAN adopts a novel sparse class-agnostic representation of instance centroids, which can not only maintain the sparsity of aligned features to solve the under-segmentation on small objects, but also reduce the computation amount of the network through sparse convolution. Our method outperforms previous methods by a large margin in the SemanticKITTI dataset for the challenging 3D PS task, achieving 1st place with a real-time inference speed.
Abstract（参考訳）: 3D LiDAR Panoptic Segmentation (PS) の2つの大きな課題は、オブジェクトの点雲が表面集約され、特に大きなインスタンスに対して長距離依存をモデル化することが困難であり、オブジェクトが互いに近すぎることである。近年の文献では、これらの問題を2重クラスタリング、平均シフトオフセットなどの時間を要するグループ化プロセスや、幾何学を軽視する鳥眼ビュー(BEV)密度セントロイド表現によって解決している。しかし, 長射程幾何学関係は, 上記の手法による局所的特徴学習では十分にモデル化されていない。そこで本稿では,マルチスケールなスパース機能をグローバルvoxelエンコードした注意と整合させ,インスタンスコンテキストの長距離関係を捉えるための,新たなスパースクロススケールアテンションネットワークであるscanを提案する。表面凝集点に対して、SCANはインスタンスセントロイドのスパースクラス非依存表現を採用しており、これは小さなオブジェクトのアンダーセグメンテーションを解決するために整列した特徴の空間を維持できるだけでなく、スパース畳み込みによるネットワークの計算量を削減することができる。提案手法は,3次元PSタスクにおいて,SemanticKITTIデータセットの大きなマージンで従来の手法よりも優れ,リアルタイム推論速度で1位となる。

関連論文リスト

Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。 PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文参考訳（メタデータ） (2024-07-26T06:29:09Z)
ClusteringSDF: Self-Organized Neural Implicit Surfaces for 3D Decomposition [32.99080359375706]
ClusteringSDFは、ニューラルな暗黙の表面表現を通して3次元のセグメンテーションと再構成を実現するための新しいアプローチである。 ScanNetとReplicaのデータセットから得られた挑戦的なシーンにおける実験結果から,ClusteringSDFが競争力を発揮することを示す。
論文参考訳（メタデータ） (2024-03-21T17:59:16Z)
Contrastive Lift: 3D Object Instance Segmentation by Slow-Fast Contrastive Fusion [110.84357383258818]
本稿では,2次元セグメントを3次元に上げ,ニューラルネットワーク表現を用いて融合させる新しい手法を提案する。このアプローチの中核は、高速なクラスタリング目的関数であり、多数のオブジェクトを持つシーンにスケーラブルで適しています。我々のアプローチは、ScanNet、Hypersim、Replicaのデータセットからの挑戦的なシーンにおいて、最先端の状況よりも優れています。
論文参考訳（メタデータ） (2023-06-07T17:57:45Z)
Spatial Pruned Sparse Convolution for Efficient 3D Object Detection [41.62839541489369]
3Dシーンは多数のバックグラウンドポイントによって支配されており、主に前景オブジェクトにフォーカスする必要がある検出タスクには冗長である。本稿では,既存の3D CNNの主要なコンポーネントを分析し,データの冗長性を無視し,さらにダウンサンプリングプロセスでそれを増幅することにより,余分な計算オーバーヘッドと不要な計算オーバーヘッドを発生させる。 SPS-ConvとSPSS-ConvとSPRSの2つの変種を含む新しい畳み込み演算子を提案する。
論文参考訳（メタデータ） (2022-09-28T16:19:06Z)
Collaborative Propagation on Multiple Instance Graphs for 3D Instance Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文参考訳（メタデータ） (2022-08-10T02:14:39Z)
CPSeg: Cluster-free Panoptic Segmentation of 3D LiDAR Point Clouds [2.891413712995641]
CPSegと呼ばれるLiDAR点雲のための新しいリアルタイム・エンド・エンド・エンド・パノプティクス・セグメンテーション・ネットワークを提案する。 CPSegは、共有エンコーダ、デュアルデコーダ、タスク認識アテンションモジュール(TAM)、クラスタフリーインスタンスセグメンテーションヘッドを備える。
論文参考訳（メタデータ） (2021-11-02T16:44:06Z)
Learning Semantic Segmentation of Large-Scale Point Clouds with Random Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文参考訳（メタデータ） (2021-07-06T05:08:34Z)
PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文参考訳（メタデータ） (2020-12-18T18:06:43Z)
DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。また、現在の最先端よりも推論速度を25%以上向上させる。
論文参考訳（メタデータ） (2020-11-26T14:56:57Z)
Spatial Semantic Embedding Network: Fast 3D Instance Segmentation with Deep Metric Learning [5.699350798684963]
ディープラーニングを用いた3次元インスタンスセグメンテーションのための,単純かつ効率的なアルゴリズムを提案する。大規模シーンからの高レベルのインテリジェントなタスクに対して、3Dインスタンスセグメンテーションはオブジェクトの個々のインスタンスを認識する。我々は,ScanNet 3D インスタンス分割ベンチマークにおいて,我々のアルゴリズムの最先端性能をAPスコアで示す。
論文参考訳（メタデータ） (2020-07-07T02:17:44Z)
Generative Sparse Detection Networks for 3D Single-shot Object Detection [43.91336826079574]
3Dオブジェクト検出は、ロボット工学や拡張現実など多くの有望な分野に適用可能であるため、広く研究されている。しかし、3Dデータのまばらな性質は、このタスクに固有の課題をもたらしている。本稿では,完全畳み込み単一ショットスパース検出ネットワークであるGenerative Sparse Detection Network (GSDN)を提案する。
論文参考訳（メタデータ） (2020-06-22T15:54:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。