論文の概要: Efficient 3D Semantic Segmentation with Superpoint Transformer
- arxiv url: http://arxiv.org/abs/2306.08045v2
- Date: Sat, 12 Aug 2023 09:55:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 19:30:47.651290
- Title: Efficient 3D Semantic Segmentation with Superpoint Transformer
- Title(参考訳): 超点変圧器を用いた効率的な3次元意味セグメンテーション
- Authors: Damien Robert, Hugo Raguet, Loic Landrieu
- Abstract要約: 大規模3次元シーンの効率的なセマンティックセマンティックセグメンテーションのための新しいスーパーポイントベースのトランスフォーマーアーキテクチャを提案する。
提案手法では,高速アルゴリズムを用いて点雲を階層的なスーパーポイント構造に分割し,前処理を既存手法の7倍高速にする。
我々のモデルは、S3DISデータセットの折りたたみに3時間で1つのGPUでトレーニングできます。
- 参考スコア(独自算出の注目度): 7.680851067579922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a novel superpoint-based transformer architecture for efficient
semantic segmentation of large-scale 3D scenes. Our method incorporates a fast
algorithm to partition point clouds into a hierarchical superpoint structure,
which makes our preprocessing 7 times faster than existing superpoint-based
approaches. Additionally, we leverage a self-attention mechanism to capture the
relationships between superpoints at multiple scales, leading to
state-of-the-art performance on three challenging benchmark datasets: S3DIS
(76.0% mIoU 6-fold validation), KITTI-360 (63.5% on Val), and DALES (79.6%).
With only 212k parameters, our approach is up to 200 times more compact than
other state-of-the-art models while maintaining similar performance.
Furthermore, our model can be trained on a single GPU in 3 hours for a fold of
the S3DIS dataset, which is 7x to 70x fewer GPU-hours than the best-performing
methods. Our code and models are accessible at
github.com/drprojects/superpoint_transformer.
- Abstract(参考訳): 大規模3dシーンの効率的なセマンティクスセグメンテーションのための,新しいスーパーポイントに基づくトランスフォーマーアーキテクチャを提案する。
提案手法は,ポイントクラウドを階層型スーパーポイント構造に分割する高速アルゴリズムを取り入れ,既存のスーパーポイントベース手法の7倍高速に前処理を行う。
さらに、複数のスケールでスーパーポイント間の関係をキャプチャする自己注意機構を活用し、S3DIS (76.0% mIoU 6-fold validation)、KITTI-360 (63.5% on Val)、DAALES (79.6%)の3つの挑戦的なベンチマークデータセット上で、最先端のパフォーマンスを実現した。
212kのパラメータしか持たないので、同様の性能を維持しつつ、他の最先端モデルよりも200倍もコンパクトです。
さらに、我々のモデルはS3DISデータセットの折りたたみに3時間で1つのGPUでトレーニングすることができる。
私たちのコードとモデルはgithub.com/drprojects/superpoint_transformerからアクセスできます。
関連論文リスト
- Scalable 3D Panoptic Segmentation As Superpoint Graph Clustering [7.680851067579922]
大規模3次元点雲のパノプティカルセグメンテーションを高効率に行う手法を提案する。
私たちのモデルは、最高の競合方法よりも30ドル以上小さく、最大15ドル以上の速度でトレーニングします。
論文 参考訳(メタデータ) (2024-01-12T17:10:52Z) - Contrastive Lift: 3D Object Instance Segmentation by Slow-Fast
Contrastive Fusion [110.84357383258818]
本稿では,2次元セグメントを3次元に上げ,ニューラルネットワーク表現を用いて融合させる新しい手法を提案する。
このアプローチの中核は、高速なクラスタリング目的関数であり、多数のオブジェクトを持つシーンにスケーラブルで適しています。
我々のアプローチは、ScanNet、Hypersim、Replicaのデータセットからの挑戦的なシーンにおいて、最先端の状況よりも優れています。
論文 参考訳(メタデータ) (2023-06-07T17:57:45Z) - Exploring Object-Centric Temporal Modeling for Efficient Multi-View 3D
Object Detection [20.161887223481994]
マルチビュー3Dオブジェクト検出のための長周期モデリングフレームワークStreamPETRを提案する。
StreamPETRは、単一フレームのベースラインと比較して、無視可能なコストでのみ、大幅なパフォーマンス向上を実現している。
軽量版は45.0%のmAPと31.7のFPSを実現し、2.3%のmAPと1.8倍の高速FPSを達成している。
論文 参考訳(メタデータ) (2023-03-21T15:19:20Z) - PartSLIP: Low-Shot Part Segmentation for 3D Point Clouds via Pretrained
Image-Language Models [56.324516906160234]
一般化可能な3D部分分割は重要だが、ビジョンとロボティクスでは難しい。
本稿では,事前学習した画像言語モデルGLIPを利用して,3次元点雲の低ショット部分分割法を提案する。
我々は2Dから3Dへの豊富な知識を、ポイントクラウドレンダリングにおけるGLIPに基づく部分検出と新しい2D-to-3Dラベルリフトアルゴリズムにより転送する。
論文 参考訳(メタデータ) (2022-12-03T06:59:01Z) - Superpoint Transformer for 3D Scene Instance Segmentation [7.07321040534471]
本稿では,SPFormer という名称の Superpoint Transformer に基づく,エンドツーエンドの3Dインスタンス分割手法を提案する。
ポイントクラウドからスーパーポイントに潜在的な機能をグループ化し、クエリベクタを通じてインスタンスを直接予測する。
これは、mAPの点でScanNetv2の隠れテストセットを4.3%上回り、高速な推論速度(フレーム当たり247ms)を同時に維持する。
論文 参考訳(メタデータ) (2022-11-28T20:52:53Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - 3DSSD: Point-based 3D Single Stage Object Detector [61.67928229961813]
本稿では,3DSSDと命名された点ベース3次元単段物体検出器を提案し,精度と効率のバランスが良好であることを示す。
提案手法は,最先端のボクセルをベースとした一段法を大差で上回り,二段法に匹敵する性能を有する。
論文 参考訳(メタデータ) (2020-02-24T12:01:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。