論文の概要: Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling
- arxiv url: http://arxiv.org/abs/2107.02389v1
- Date: Tue, 6 Jul 2021 05:08:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-07 13:56:24.329671
- Title: Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling
- Title(参考訳): ランダムサンプリングによる大規模点雲の意味セグメンテーションの学習
- Authors: Qingyong Hu, Bo Yang, Linhai Xie, Stefano Rosa, Yulan Guo, Zhihua
Wang, Niki Trigoni and Andrew Markham
- Abstract要約: 我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
- 参考スコア(独自算出の注目度): 52.464516118826765
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We study the problem of efficient semantic segmentation of large-scale 3D
point clouds. By relying on expensive sampling techniques or computationally
heavy pre/post-processing steps, most existing approaches are only able to be
trained and operate over small-scale point clouds. In this paper, we introduce
RandLA-Net, an efficient and lightweight neural architecture to directly infer
per-point semantics for large-scale point clouds. The key to our approach is to
use random point sampling instead of more complex point selection approaches.
Although remarkably computation and memory efficient, random sampling can
discard key features by chance. To overcome this, we introduce a novel local
feature aggregation module to progressively increase the receptive field for
each 3D point, thereby effectively preserving geometric details. Comparative
experiments show that our RandLA-Net can process 1 million points in a single
pass up to 200x faster than existing approaches. Moreover, extensive
experiments on five large-scale point cloud datasets, including Semantic3D,
SemanticKITTI, Toronto3D, NPM3D and S3DIS, demonstrate the state-of-the-art
semantic segmentation performance of our RandLA-Net.
- Abstract(参考訳): 大規模3次元点雲の効率的なセマンティックセグメンテーションの問題について検討する。
高価なサンプリング技術や計算的に重い前/後処理ステップに頼ることで、既存のアプローチのほとんどは、小規模のポイントクラウド上でのみトレーニングと運用が可能である。
本稿では,大規模クラウドに対して,ポイントごとのセマンティクスを直接推論する,効率的かつ軽量なニューラルネットワークであるRandLA-Netを紹介する。
私たちのアプローチの鍵は、より複雑なポイント選択アプローチではなく、ランダムなポイントサンプリングを使用することです。
驚くべき計算とメモリ効率は高いが、ランダムサンプリングは偶然キー機能を破棄することができる。
そこで我々は,各3次元点に対する受容場を徐々に増加させ,幾何学的詳細を効果的に保存する,新しい局所的特徴集約モジュールを提案する。
比較実験により、我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できることがわかった。
さらに、semantic3d、semantickitti、トロント3d、npm3d、s3disを含む5つの大規模ポイントクラウドデータセットに関する広範な実験により、randra-netの最先端セマンティックセグメンテーション性能が実証された。
関連論文リスト
- Multi-modality Affinity Inference for Weakly Supervised 3D Semantic
Segmentation [47.81638388980828]
本稿では,マルチモーダルポイント親和性推論モジュールを新たに導入した,シンプルで効果的なシーンレベルの弱教師付きポイントクラウドセグメンテーション法を提案する。
ScanNet と S3DIS のベンチマークでは,最先端の ScanNet と S3DIS のベンチマークでは 4% から 6% の mIoU を達成している。
論文 参考訳(メタデータ) (2023-12-27T14:01:35Z) - PointeNet: A Lightweight Framework for Effective and Efficient Point
Cloud Analysis [28.54939134635978]
PointeNetは、ポイントクラウド分析に特化したネットワークである。
本手法は,分類/分割ヘッドとシームレスに統合したり,市販の3Dオブジェクト検出ネットワークに埋め込んだりすることで,柔軟性を示す。
ModelNet40、ScanObjectNN、ShapeNet KITTI、およびシーンレベルのデータセットKITTIを含むオブジェクトレベルのデータセットの実験は、ポイントクラウド分析における最先端メソッドよりもPointeNetの方が優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-12-20T03:34:48Z) - Dynamic Clustering Transformer Network for Point Cloud Segmentation [23.149220817575195]
動的クラスタリングトランスネットワーク(DCTNet)と呼ばれる新しい3Dポイントクラウド表現ネットワークを提案する。
エンコーダ-デコーダアーキテクチャがあり、ローカルとグローバルの両方の機能学習が可能である。
提案手法は,オブジェクトベースデータセット(ShapeNet),都市ナビゲーションデータセット(Toronto-3D),マルチスペクトルLiDARデータセットを用いて評価した。
論文 参考訳(メタデータ) (2023-05-30T01:11:05Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - MVP-Net: Multiple View Pointwise Semantic Segmentation of Large-Scale
Point Clouds [13.260488842875649]
本稿では,KNNや複雑な前/後処理を使わずに大規模屋外点クラウドを効率的に推論する,エンドツーエンドのニューラルネットワークであるMultiple View Pointwise Net,MVP-Netを提案する。
数値実験により,提案したMVP-Netは,最も効率的なポイントワイドセマンティックセマンティックセグメンテーション法であるRandLA-Netの11倍高速であることがわかった。
論文 参考訳(メタデータ) (2022-01-30T09:43:00Z) - Local Grid Rendering Networks for 3D Object Detection in Point Clouds [98.02655863113154]
CNNは強力だが、全点の雲を高密度の3Dグリッドに酸化した後、点データに直接畳み込みを適用するのは計算コストがかかる。
入力点のサブセットの小さな近傍を低解像度の3Dグリッドに独立してレンダリングする,新しい,原理化されたローカルグリッドレンダリング(LGR)演算を提案する。
ScanNetとSUN RGB-Dデータセットを用いた3次元オブジェクト検出のためのLGR-Netを検証する。
論文 参考訳(メタデータ) (2020-07-04T13:57:43Z) - Segment as Points for Efficient Online Multi-Object Tracking and
Segmentation [66.03023110058464]
本稿では,コンパクトな画像表現を非秩序な2次元点クラウド表現に変換することで,セグメントに基づくインスタンス埋め込みの学習に有効な方法を提案する。
本手法は,画像ではなく,ランダムに選択された点から識別インスタンスの埋め込みを学習する,新たなトラッキング・バイ・ポイントのパラダイムを生成する。
PointTrackという名前のオンラインMOTSフレームワークは、最先端のすべてのメソッドを大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-07-03T08:29:35Z) - 3DSSD: Point-based 3D Single Stage Object Detector [61.67928229961813]
本稿では,3DSSDと命名された点ベース3次元単段物体検出器を提案し,精度と効率のバランスが良好であることを示す。
提案手法は,最先端のボクセルをベースとした一段法を大差で上回り,二段法に匹敵する性能を有する。
論文 参考訳(メタデータ) (2020-02-24T12:01:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。