論文の概要: Collect-and-Distribute Transformer for 3D Point Cloud Analysis
- arxiv url: http://arxiv.org/abs/2306.01257v1
- Date: Fri, 2 Jun 2023 03:48:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-05 16:53:39.448042
- Title: Collect-and-Distribute Transformer for 3D Point Cloud Analysis
- Title(参考訳): 3次元点雲解析のための集配変圧器
- Authors: Haibo Qiu, Baosheng Yu, Dacheng Tao
- Abstract要約: 本稿では,点雲の短距離・長距離コンテキストを伝達する収集・分散機構を備えた新しい変圧器アーキテクチャを提案する。
その結果,提案したCDFormerの有効性が示され,ポイントクラウドの分類とセグメンテーションタスクにおける最先端のパフォーマンスがいくつか提供された。
- 参考スコア(独自算出の注目度): 91.15865862160088
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Although remarkable advancements have been made recently in point cloud
analysis through the exploration of transformer architecture, it remains
challenging to effectively learn local and global structures within point
clouds. In this paper, we propose a new transformer architecture equipped with
a collect-and-distribute mechanism to communicate short- and long-range
contexts of point clouds, which we refer to as CDFormer. Specifically, we first
utilize self-attention to capture short-range interactions within each local
patch, and the updated local features are then collected into a set of proxy
reference points from which we can extract long-range contexts. Afterward, we
distribute the learned long-range contexts back to local points via
cross-attention. To address the position clues for short- and long-range
contexts, we also introduce context-aware position encoding to facilitate
position-aware communications between points. We perform experiments on four
popular point cloud datasets, namely ModelNet40, ScanObjectNN, S3DIS, and
ShapeNetPart, for classification and segmentation. Results show the
effectiveness of the proposed CDFormer, delivering several new state-of-the-art
performances on point cloud classification and segmentation tasks. The code is
available at \url{https://github.com/haibo-qiu/CDFormer}.
- Abstract(参考訳): 変圧器アーキテクチャの探索を通じて、最近ポイントクラウド解析において顕著な進歩がなされているが、ポイントクラウド内のローカルおよびグローバル構造を効果的に学ぶことは依然として困難である。
本稿では,ポイント・クラウドの短距離および長距離のコンテキストを通信するための収集・配信機構を備えた,cdformerと呼ばれる新しいトランスフォーマティブ・アーキテクチャを提案する。
具体的には、まず最初に自己注意を利用して各ローカルパッチ内の短距離インタラクションをキャプチャし、更新されたローカル特徴を一連のプロキシ参照ポイントに収集し、長距離コンテキストを抽出する。
その後、学習した長距離コンテキストをクロスアテンションを通じてローカルポイントに分散する。
短距離および長距離の文脈における位置手がかりに対処するために,ポイント間の位置認識通信を容易にするために,文脈認識位置符号化を導入する。
分類とセグメンテーションのために,ModelNet40,ScanObjectNN,S3DIS,ShapeNetPartの4つの人気ポイントクラウドデータセットで実験を行った。
その結果,提案するcdformerの有効性が示され,ポイントクラウド分類とセグメンテーションタスクにおいて最新の性能がいくつか提供されている。
コードは \url{https://github.com/haibo-qiu/cdformer} で入手できる。
関連論文リスト
- Few-Shot 3D Point Cloud Semantic Segmentation via Stratified
Class-Specific Attention Based Transformer Network [22.9434434107516]
数ショットのクラウドセマンティックセマンティックセグメンテーションのための新しい多層トランスフォーマーネットワークを開発した。
提案手法は,既存の数ショットの3Dポイントクラウドセグメンテーションモデルよりも15%少ない推論時間で,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-28T00:27:54Z) - Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。
従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。
本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-20T07:10:14Z) - Graph Neural Network and Spatiotemporal Transformer Attention for 3D
Video Object Detection from Point Clouds [94.21415132135951]
複数のフレームにおける時間情報を利用して3次元物体を検出することを提案する。
我々は,一般的なアンカーベースおよびアンカーフリー検出器に基づくアルゴリズムを実装した。
論文 参考訳(メタデータ) (2022-07-26T05:16:28Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - Deep Point Cloud Reconstruction [74.694733918351]
3Dスキャンから得られる点雲は、しばしばスパース、ノイズ、不規則である。
これらの問題に対処するため、最近の研究は別々に行われ、不正確な点雲を密度化、復調し、完全な不正確な点雲を観測している。
本研究では,1) 初期密度化とデノナイズのための3次元スパース集積時間ガラスネットワーク,2) 離散ボクセルを3Dポイントに変換するトランスフォーマーによる改良,の2段階からなる深部点雲再構成ネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T07:53:28Z) - Learning point embedding for 3D data processing [2.12121796606941]
現在の点ベース法は本質的に空間関係処理ネットワークである。
PE-Netは高次元空間における点雲の表現を学習する。
実験によると、PE-Netは複数の挑戦的なデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-07-19T00:25:28Z) - Compositional Prototype Network with Multi-view Comparision for Few-Shot
Point Cloud Semantic Segmentation [47.0611707526858]
完全に教師ありのポイントクラウドセグメンテーションネットワークは、しばしばポイントワイズアノテーションを持つ大量のデータを必要とする。
少数のラベル付きトレーニングデータだけでポイントクラウドのセグメンテーションを行うことができるコンポジションプロトタイプネットワークを紹介します。
画像中の少数の学習文献にインスパイアされたネットワークは、限られたトレーニングデータから予測のためのラベルのないテストデータに直接ラベル情報を転送します。
論文 参考訳(メタデータ) (2020-12-28T15:01:34Z) - Dense-Resolution Network for Point Cloud Classification and Segmentation [42.316932316581635]
DRNetは、異なる解像度でポイントクラウドからローカルポイント機能を学ぶように設計されている。
広く使われているポイントクラウドセグメンテーションと分類ベンチマークでネットワークを検証することに加えて、コンポーネントのパフォーマンスをテストし視覚化する。
論文 参考訳(メタデータ) (2020-05-14T06:13:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。