論文の概要: Point Cloud Classification Using Content-based Transformer via
Clustering in Feature Space
- arxiv url: http://arxiv.org/abs/2303.04599v1
- Date: Wed, 8 Mar 2023 14:11:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-09 13:45:03.156640
- Title: Point Cloud Classification Using Content-based Transformer via
Clustering in Feature Space
- Title(参考訳): 特徴空間におけるクラスタリングによるコンテンツベーストランスフォーマによるポイントクラウド分類
- Authors: Yahui Liu, Bin Tian, Yisheng Lv, Lingxi Li, Feiyue Wang
- Abstract要約: 本稿では,PointConTと呼ばれるポイントコンテントベースのトランスフォーマーアーキテクチャを提案する。
特徴空間内の点(コンテンツベース)の局所性を利用して、類似した特徴を持つサンプルポイントを同じクラスにクラスタし、各クラス内の自己アテンションを計算する。
また,各枝の高周波・低周波情報を並列構造を用いて個別に集約するインセプション機能アグリゲータも導入した。
- 参考スコア(独自算出の注目度): 25.57569871876213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, there have been some attempts of Transformer in 3D point cloud
classification. In order to reduce computations, most existing methods focus on
local spatial attention, but ignore their content and fail to establish
relationships between distant but relevant points. To overcome the limitation
of local spatial attention, we propose a point content-based Transformer
architecture, called PointConT for short. It exploits the locality of points in
the feature space (content-based), which clusters the sampled points with
similar features into the same class and computes the self-attention within
each class, thus enabling an effective trade-off between capturing long-range
dependencies and computational complexity. We further introduce an Inception
feature aggregator for point cloud classification, which uses parallel
structures to aggregate high-frequency and low-frequency information in each
branch separately. Extensive experiments show that our PointConT model achieves
a remarkable performance on point cloud shape classification. Especially, our
method exhibits 90.3% Top-1 accuracy on the hardest setting of ScanObjectNN.
Source code of this paper is available at
https://github.com/yahuiliu99/PointConT.
- Abstract(参考訳): 最近、3Dポイントクラウド分類におけるTransformerの試みがある。
計算量を削減するため、既存の手法のほとんどは局所的な空間的注意に重点を置いているが、その内容は無視し、遠いが関連する点間の関係を確立できない。
局所的な空間的注意の制限を克服するため,PointConTと呼ばれるポイントコンテンツベースのトランスフォーマーアーキテクチャを提案する。
類似した機能を持つサンプリングされたポイントを同じクラスに集約し、各クラス内のセルフアテンションを計算する機能空間(コンテントベース)内のポイントの局所性を活用し、長距離依存関係のキャプチャと計算複雑性の間の効果的なトレードオフを可能にする。
さらに,並列構造を用いて各ブランチの高周波・低周波情報を別々に集約する,ポイントクラウド分類のためのインセプション特徴集約器についても紹介する。
我々のPointConTモデルは点雲の形状分類において顕著な性能を示す。
特に,ScanObjectNNの難易度に90.3%のTop-1精度を示す。
この論文のソースコードはhttps://github.com/yahuiliu99/pointcontで入手できる。
関連論文リスト
- ConDaFormer: Disassembled Transformer with Local Structure Enhancement
for 3D Point Cloud Understanding [105.98609765389895]
トランスフォーマーは、最近3Dポイントクラウド理解のために研究されている。
0.1万を超える多数のポイントは、ポイントクラウドデータに対してグローバルな自己注意を可能にする。
本稿では,ConDaFormerという新しい変圧器ブロックを開発する。
論文 参考訳(メタデータ) (2023-12-18T11:19:45Z) - FreePoint: Unsupervised Point Cloud Instance Segmentation [72.64540130803687]
点クラウド上の教師なしクラス非依存のインスタンスセグメンテーションを探索するためのFreePointを提案する。
我々は、座標、色、そして自己監督の深い特徴を組み合わせることで、点の特徴を表現する。
ポイント機能に基づいて、ポイントクラウドを擬似ラベルとして粗いインスタンスマスクに分割し、ポイントクラウドインスタンスセグメンテーションモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-05-11T16:56:26Z) - Self-positioning Point-based Transformer for Point Cloud Understanding [18.394318824968263]
セルフポジショニングポイントベースのトランスフォーマー(SPoTr)は、局所的およびグローバルな形状のコンテキストを複雑さを減らしてキャプチャするように設計されている。
SPoTrは、ScanObjectNNを用いた形状分類における以前の最良のモデルよりも精度が2.6%向上している。
論文 参考訳(メタデータ) (2023-03-29T04:27:11Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - 3D Object Tracking with Transformer [6.848996369226086]
特徴融合は、対象のオブジェクト情報を含めることで、類似性コンピューティングをより効率的にする。
既存のLiDARベースのアプローチのほとんどは、抽出されたポイントクラウド機能を直接使用して類似性を計算している。
本稿では,トランスアーキテクチャに基づく機能融合ネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-28T07:03:19Z) - Fast Point Voxel Convolution Neural Network with Selective Feature
Fusion for Point Cloud Semantic Segmentation [7.557684072809662]
本稿では,ポイントクラウド解析のための軽量畳み込みニューラルネットワークを提案する。
本手法はサンプリングなしで全点集合上で動作し,効率よく性能を向上する。
論文 参考訳(メタデータ) (2021-09-23T19:39:01Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - SCTN: Sparse Convolution-Transformer Network for Scene Flow Estimation [71.2856098776959]
点雲は非秩序であり、その密度は著しく一様ではないため、点雲の3次元運動の推定は困難である。
本稿では,sparse convolution-transformer network (sctn) という新しいアーキテクチャを提案する。
学習した関係に基づく文脈情報が豊富で,対応点の一致に役立ち,シーンフローの推定に有効であることを示す。
論文 参考訳(メタデータ) (2021-05-10T15:16:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。