論文の概要: VTPNet for 3D deep learning on point cloud
- arxiv url: http://arxiv.org/abs/2305.06115v1
- Date: Wed, 10 May 2023 13:07:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-11 13:13:01.539310
- Title: VTPNet for 3D deep learning on point cloud
- Title(参考訳): ポイントクラウド上での3次元ディープラーニングのためのVTPNet
- Authors: Wei Zhou, Weiwei Jin, Qian Wang, Yifan Wang, Dekui Wang, Xingxing Hao,
Yongxiang Yu
- Abstract要約: Voxel-Transformer-Point(VTP)ブロックは、ポイントクラウドの局所的およびグローバル的特徴を抽出する。
VTPは、ボクセルベース、ポイントベース、トランスフォーマーベースの方法の利点を組み合わせたものである。
実験の結果、VTPNetは3Dポイントのクラウド学習において優れたパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 10.470127366415813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, Transformer-based methods for point cloud learning have achieved
good results on various point cloud learning benchmarks. However, since the
attention mechanism needs to generate three feature vectors of query, key, and
value to calculate attention features, most of the existing Transformer-based
point cloud learning methods usually consume a large amount of computational
time and memory resources when calculating global attention. To address this
problem, we propose a Voxel-Transformer-Point (VTP) Block for extracting local
and global features of point clouds. VTP combines the advantages of
voxel-based, point-based and Transformer-based methods, which consists of
Voxel-Based Branch (V branch), Point-Based Transformer Branch (PT branch) and
Point-Based Branch (P branch). The V branch extracts the coarse-grained
features of the point cloud through low voxel resolution; the PT branch obtains
the fine-grained features of the point cloud by calculating the self-attention
in the local neighborhood and the inter-neighborhood cross-attention; the P
branch uses a simplified MLP network to generate the global location
information of the point cloud. In addition, to enrich the local features of
point clouds at different scales, we set the voxel scale in the V branch and
the neighborhood sphere scale in the PT branch to one large and one small
(large voxel scale \& small neighborhood sphere scale or small voxel scale \&
large neighborhood sphere scale). Finally, we use VTP as the feature extraction
network to construct a VTPNet for point cloud learning, and performs shape
classification, part segmentation, and semantic segmentation tasks on the
ModelNet40, ShapeNet Part, and S3DIS datasets. The experimental results
indicate that VTPNet has good performance in 3D point cloud learning.
- Abstract(参考訳): 近年,ポイントクラウドラーニングのためのTransformerベースの手法は,さまざまなポイントクラウドラーニングベンチマークで良好な結果を得た。
しかしながら、アテンションメカニズムは、アテンション特徴を計算するためにクエリ、キー、値の3つの特徴ベクトルを生成する必要があるため、既存のTransformerベースのポイントクラウド学習手法のほとんどは、グローバルアテンションを計算する際に、大量の計算時間とメモリリソースを消費する。
この問題に対処するため,Voxel-Transformer-Point(VTP)ブロックを提案し,点雲の局所的特徴とグローバルな特徴を抽出する。
vtpは、voxel-based branch (vブランチ)、point-based transformer branch (ptブランチ)、point-based branch (pブランチ)からなるvoxel-based、point-based、transformer-based methodの利点を組み合わせる。
v分枝は、低ボクセル分解能で点雲の粗粒度を抽出し、pt分枝は、局所近傍の自着率と近距離交叉率を算出し、点雲の細粒度特徴を得る。p分枝は、簡略化されたmlpネットワークを使用して点雲のグローバル位置情報を生成する。
さらに,点雲の局所的な特徴を異なるスケールで高めるため,pt枝のv枝と近傍球スケールのボクセルスケールを1つの大きな1つの小さなボクセルスケールに設定した(大ボクセルスケール \&小近傍球スケールまたは小ボクセルスケール \&大近傍球スケール)。
最後に、VTPを特徴抽出ネットワークとして、ポイントクラウド学習のためのVTPNetを構築し、ModelNet40、ShapeNet Part、S3DISデータセット上で、形状分類、部分分割、セマンティックセグメンテーションタスクを実行する。
実験の結果,VTPNetは3Dポイントのクラウド学習において優れた性能を示した。
関連論文リスト
- PIVOT-Net: Heterogeneous Point-Voxel-Tree-based Framework for Point
Cloud Compression [8.778300313732027]
異種クラウド圧縮(PCC)フレームワークを提案する。
私たちは、典型的なポイントクラウド表現 -- ポイントベース、ボクセルベース、ツリーベース表現 -- と関連するバックボーンを統一します。
本稿では,デコードのためのコンテキスト対応アップサンプリングと,機能集約のための拡張ボクセルトランスフォーマーによりフレームワークを増強する。
論文 参考訳(メタデータ) (2024-02-11T16:57:08Z) - Collect-and-Distribute Transformer for 3D Point Cloud Analysis [82.03517861433849]
本稿では,点雲の短距離・長距離コンテキストを通信するための収集・分散機構を備えた新しい変圧器ネットワークを提案する。
その結果,提案したCDFormerの有効性が示され,ポイントクラウドの分類とセグメンテーションタスクにおける最先端のパフォーマンスがいくつか提供された。
論文 参考訳(メタデータ) (2023-06-02T03:48:45Z) - GTNet: Graph Transformer Network for 3D Point Cloud Classification and Semantic Segmentation [10.596757615219207]
グラフベースのディープラーニングネットワークとTransformerベースのディープラーニングネットワークは、さまざまなポイントクラウドタスクで優れたパフォーマンスを示している。
本稿では,Graph Transformerという新機能抽出ブロックを提案し,GTNetと呼ばれる3Dポイントクラウド学習ネットワークを構築した。
論文 参考訳(メタデータ) (2023-05-24T14:51:18Z) - PointAttN: You Only Need Attention for Point Cloud Completion [89.88766317412052]
ポイント・クラウド・コンプリート(Point cloud completion)とは、部分的な3次元ポイント・クラウドから3次元の形状を完成させることである。
そこで我々は,kNNを除去するために,ポイントクラウドをポイント単位に処理する新しいニューラルネットワークを提案する。
提案するフレームワークであるPointAttNはシンプルで簡潔で効果的であり、3次元形状の構造情報を正確に捉えることができる。
論文 参考訳(メタデータ) (2022-03-16T09:20:01Z) - Point cloud completion on structured feature map with feedback network [28.710494879042002]
本稿では,FSNetを提案する。FSNetは,ポイントワイドな特徴を適応的に2次元構造的特徴マップに集約できる機能構造化モジュールである。
2次元畳み込みニューラルネットワークを用いて、FSNetから粗い完全点クラウドに特徴マップをデコードする。
点雲アップサンプリングネットワークを用いて、部分入力と粗い中間出力から高密度点雲を生成する。
論文 参考訳(メタデータ) (2022-02-17T10:59:40Z) - GSIP: Green Semantic Segmentation of Large-Scale Indoor Point Clouds [64.86292006892093]
GSIP (Green of Indoor Point clouds) は大規模屋内シーンポイント雲のセマンティックセグメンテーションの効率的なソリューションである。
GSIPには2つの新しいコンポーネントがある: 1) 更なる処理のためにポイントの適切なサブセットを選択するルームスタイルのデータ前処理方法、2) ポイントホップから拡張された新しい特徴抽出器。
実験の結果、GSIPはS3DISデータセットのセグメンテーション性能においてPointNetよりも優れていた。
論文 参考訳(メタデータ) (2021-09-24T09:26:53Z) - Fast Point Voxel Convolution Neural Network with Selective Feature
Fusion for Point Cloud Semantic Segmentation [7.557684072809662]
本稿では,ポイントクラウド解析のための軽量畳み込みニューラルネットワークを提案する。
本手法はサンプリングなしで全点集合上で動作し,効率よく性能を向上する。
論文 参考訳(メタデータ) (2021-09-23T19:39:01Z) - PoinTr: Diverse Point Cloud Completion with Geometry-Aware Transformers [81.71904691925428]
本稿では,ポイントクラウドの完了をセット・ツー・セットの翻訳問題として再定義する手法を提案する。
我々はまた、ポイントクラウド補完のためにトランスフォーマーエンコーダデコーダアーキテクチャを採用するPoinTrと呼ばれる新しいモデルも設計している。
提案手法は,新しいベンチマークと既存ベンチマークの両方において,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T17:58:56Z) - ODFNet: Using orientation distribution functions to characterize 3D
point clouds [0.0]
点まわりの点配向分布を利用して、点群の表現力のある局所近傍表現を得ます。
新しい ODFNet モデルは ModelNet40 と ScanObjectNN データセットのオブジェクト分類における最先端の精度を実現する。
論文 参考訳(メタデータ) (2020-12-08T19:54:20Z) - SoftPoolNet: Shape Descriptor for Point Cloud Completion and
Classification [93.54286830844134]
本稿では,点雲に基づく3次元オブジェクトの補完と分類手法を提案する。
デコーダの段階では,グローバルな活性化エントロピーの最大化を目的とした新しい演算子である地域畳み込みを提案する。
我々は,オブジェクトの完成度や分類,最先端の精度の達成など,異なる3次元タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2020-08-17T14:32:35Z) - GRNet: Gridding Residual Network for Dense Point Cloud Completion [54.43648460932248]
完全な3Dポイントクラウドを不完全なクラウドから推定することは、多くのビジョンやロボティクスアプリケーションにおいて重要な問題である。
本稿では,ポイントクラウド補完のための新しいGridding Residual Network(GRNet)を提案する。
実験結果から,提案したGRNetはShapeNet,Completion3D,KITTIベンチマークの最先端手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-06-06T02:46:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。