論文の概要: LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD
- arxiv url: http://arxiv.org/abs/2210.05870v1
- Date: Wed, 12 Oct 2022 02:11:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 14:39:50.410492
- Title: LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD
- Title(参考訳): LACV-Net:局所適応VLADによる大規模クラウドシーンのセマンティックセグメンテーション
- Authors: Ziyin Zeng, Yongyang Xu, Zhong Xie, Wei Tang, Jie Wan and Weichao Wu
- Abstract要約: 本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
- 参考スコア(独自算出の注目度): 13.907586081922345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale point cloud semantic segmentation is an important task in 3D
computer vision, which is widely applied in autonomous driving, robotics, and
virtual reality. Current large-scale point cloud semantic segmentation methods
usually use down-sampling operations to improve computation efficiency and
acquire point clouds with multi-resolution. However, this may cause the problem
of missing local information. Meanwhile, it is difficult for networks to
capture global information in large-scale distributed contexts. To capture
local and global information effectively, we propose an end-to-end deep neural
network called LACV-Net for large-scale point cloud semantic segmentation. The
proposed network contains three main components: 1) a local adaptive feature
augmentation module (LAFA) to adaptively learn the similarity of centroids and
neighboring points to augment the local context; 2) a comprehensive VLAD module
(C-VLAD) that fuses local features with multi-layer, multi-scale, and
multi-resolution to represent a comprehensive global description vector; and 3)
an aggregation loss function to effectively optimize the segmentation
boundaries by constraining the adaptive weight from the LAFA module. Compared
to state-of-the-art networks on several large-scale benchmark datasets,
including S3DIS, Toronto3D, and SensatUrban, we demonstrated the effectiveness
of the proposed network.
- Abstract(参考訳): 大規模なポイントクラウドセマンティクスセグメンテーションは、3dコンピュータビジョンにおいて重要なタスクであり、自動運転、ロボティクス、バーチャルリアリティーに広く適用されている。
現在の大規模ポイントクラウドセマンティクスセグメンテーション手法は通常、ダウンサンプリング操作を使用して計算効率を改善し、マルチレゾリューションでポイントクラウドを取得する。
しかし、これはローカル情報の欠落を引き起こす可能性がある。
一方,大規模分散環境において,ネットワークがグローバル情報を捉えることは困難である。
ローカルおよびグローバル情報を効果的に捉えるために,大規模ポイントクラウドセマンティクスセグメンテーションのためのlacv-netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークには3つの主要コンポーネントがある。
1) 局所適応的特徴増強モジュール(LAFA)は、遠心点と隣接点の類似性を適応的に学習し、局所的文脈を増強する。
2) 包括的グローバル記述ベクトルを表すために,局所的特徴を多層,マルチスケール,マルチ解像度で融合する包括的VLADモジュール(C-VLAD)
3) LAFAモジュールからの適応重みを制約することにより, セグメンテーション境界を効果的に最適化するアグリゲーション損失関数。
S3DIS, Toronto3D, SensatUrbanなど, 大規模ベンチマークデータセットの最先端ネットワークと比較して, 提案ネットワークの有効性を実証した。
関連論文リスト
- Efficiently Expanding Receptive Fields: Local Split Attention and Parallel Aggregation for Enhanced Large-scale Point Cloud Semantic Segmentation [7.199090922071512]
本研究では,複数の局所分割操作を通じて受容領域を効果的に拡張するLSAP機構を提案する。
本研究では,大規模クラウドセマンティックセマンティックセグメンテーションのための新しいフレームワークLSNetを提案する。
LSNetは3つのベンチマークデータセット上の最先端セマンティックセグメンテーションネットワークよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-09-03T07:10:20Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - SWCF-Net: Similarity-weighted Convolution and Local-global Fusion for Efficient Large-scale Point Cloud Semantic Segmentation [10.328077317786342]
SWCF-Net という名前の類似度重み付き畳み込みとローカル・グローバル・フュージョン・ネットワークを提案する。
提案手法は計算コストを削減し,大規模点群を効率的に処理できる。
論文 参考訳(メタデータ) (2024-06-17T11:54:46Z) - PointeNet: A Lightweight Framework for Effective and Efficient Point
Cloud Analysis [28.54939134635978]
PointeNetは、ポイントクラウド分析に特化したネットワークである。
本手法は,分類/分割ヘッドとシームレスに統合したり,市販の3Dオブジェクト検出ネットワークに埋め込んだりすることで,柔軟性を示す。
ModelNet40、ScanObjectNN、ShapeNet KITTI、およびシーンレベルのデータセットKITTIを含むオブジェクトレベルのデータセットの実験は、ポイントクラウド分析における最先端メソッドよりもPointeNetの方が優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-12-20T03:34:48Z) - LCPFormer: Towards Effective 3D Point Cloud Analysis via Local Context
Propagation in Transformers [60.51925353387151]
本稿では,近隣地域間のメッセージパッシングを活用するために,LCP (Local Context Propagation) という新しいモジュールを提案する。
隣接するローカル領域の重複点を仲介として使用した後、異なるローカルリージョンからの共有ポイントの特徴を再重み付けし、その後、次のレイヤに渡す。
提案手法は, 異なるタスクに適用可能であり, 3次元形状分類や高密度予測タスクを含むベンチマークにおいて, 様々なトランスフォーマーベースの手法より優れる。
論文 参考訳(メタデータ) (2022-10-23T15:43:01Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - Multi-scale Network with Attentional Multi-resolution Fusion for Point
Cloud Semantic Segmentation [2.964101313270572]
ローカルおよびグローバルなマルチスケール情報を集約する総合的なポイントクラウドセマンティックセマンティックセマンティクスネットワークを提案する。
点の局所的な形状を効果的に学習するアングル相関点畳み込みモジュールを提案する。
第3に、2Dイメージビジョンタスクのパフォーマンスに優れたHRNetにインスパイアされた私たちは、ポイントクラウド用にカスタマイズされたHRNetを構築し、グローバルなマルチスケールコンテキストを学習します。
論文 参考訳(メタデータ) (2022-06-27T21:03:33Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - PRA-Net: Point Relation-Aware Network for 3D Point Cloud Analysis [56.91758845045371]
我々はポイント関係認識ネットワーク(PRA-Net)という新しいフレームワークを提案する。
領域内構造学習(ISL)モジュールと領域間関係学習(IRL)モジュールで構成されている。
形状分類,キーポイント推定,部分セグメンテーションを含む複数の3次元ベンチマーク実験により,PRA-Netの有効性と性能が検証された。
論文 参考訳(メタデータ) (2021-12-09T13:24:43Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - Efficient 3D Point Cloud Feature Learning for Large-Scale Place
Recognition [21.818744369503197]
視覚的位置認識のためのグローバルディスクリプタを構築するために,効率的なポイントクラウド学習ネットワーク(EPC-Net)を開発した。
提案手法は,フレームあたりのパラメータ,FLOP,ランタイムを低減して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-01-07T05:15:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。