論文の概要: Collect-and-Distribute Transformer for 3D Point Cloud Analysis
- arxiv url: http://arxiv.org/abs/2306.01257v2
- Date: Tue, 31 Oct 2023 03:55:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 23:53:37.505844
- Title: Collect-and-Distribute Transformer for 3D Point Cloud Analysis
- Title(参考訳): 3次元点雲解析のための集配変圧器
- Authors: Haibo Qiu, Baosheng Yu, Dacheng Tao
- Abstract要約: 本稿では,点雲の短距離・長距離コンテキストを通信するための収集・分散機構を備えた新しい変圧器ネットワークを提案する。
その結果,提案したCDFormerの有効性が示され,ポイントクラウドの分類とセグメンテーションタスクにおける最先端のパフォーマンスがいくつか提供された。
- 参考スコア(独自算出の注目度): 82.03517861433849
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Remarkable advancements have been made recently in point cloud analysis
through the exploration of transformer architecture, but it remains challenging
to effectively learn local and global structures within point clouds. In this
paper, we propose a new transformer network equipped with a
collect-and-distribute mechanism to communicate short- and long-range contexts
of point clouds, which we refer to as CDFormer. Specifically, we first employ
self-attention to capture short-range interactions within each local patch, and
the updated local features are then collected into a set of proxy reference
points from which we can extract long-range contexts. Afterward, we distribute
the learned long-range contexts back to local points via cross-attention. To
address the position clues for short- and long-range contexts, we additionally
introduce the context-aware position encoding to facilitate position-aware
communications between points. We perform experiments on five popular point
cloud datasets, namely ModelNet40, ScanObjectNN, ShapeNetPart, S3DIS and
ScanNetV2, for classification and segmentation. Results show the effectiveness
of the proposed CDFormer, delivering several new state-of-the-art performances
on point cloud classification and segmentation tasks. The source code is
available at \url{https://github.com/haibo-qiu/CDFormer}.
- Abstract(参考訳): 変圧器アーキテクチャの探索を通じて,近年,ポイントクラウド解析が注目されているが,ポイントクラウド内の局所構造やグローバル構造を効果的に学習することは依然として困難である。
本稿では,CDFormerと呼ばれる点雲の近距離・短距離コンテキストを通信するための収集・分散機構を備えた新しい変圧器ネットワークを提案する。
具体的には、まず、各ローカルパッチ内の短距離インタラクションをキャプチャするために自己アテンションを使用し、更新されたローカル特徴をプロキシ参照ポイントのセットに収集し、長距離コンテキストを抽出する。
その後、学習した長距離コンテキストをクロスアテンションを通じてローカルポイントに分散する。
短距離および長距離の文脈における位置手がかりに対処するために,ポイント間の位置認識通信を容易にする文脈認識位置符号化を導入する。
分類とセグメンテーションのために,ModelNet40,ScanObjectNN,ShapeNetPart,S3DIS,ScanNetV2の5つの人気ポイントクラウドデータセットで実験を行った。
その結果,提案するcdformerの有効性が示され,ポイントクラウド分類とセグメンテーションタスクにおいて最新の性能がいくつか提供されている。
ソースコードは \url{https://github.com/haibo-qiu/CDFormer} で入手できる。
関連論文リスト
- Few-Shot 3D Point Cloud Semantic Segmentation via Stratified
Class-Specific Attention Based Transformer Network [22.9434434107516]
数ショットのクラウドセマンティックセマンティックセグメンテーションのための新しい多層トランスフォーマーネットワークを開発した。
提案手法は,既存の数ショットの3Dポイントクラウドセグメンテーションモデルよりも15%少ない推論時間で,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-28T00:27:54Z) - Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。
従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。
本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-20T07:10:14Z) - Graph Neural Network and Spatiotemporal Transformer Attention for 3D
Video Object Detection from Point Clouds [94.21415132135951]
複数のフレームにおける時間情報を利用して3次元物体を検出することを提案する。
我々は,一般的なアンカーベースおよびアンカーフリー検出器に基づくアルゴリズムを実装した。
論文 参考訳(メタデータ) (2022-07-26T05:16:28Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - Deep Point Cloud Reconstruction [74.694733918351]
3Dスキャンから得られる点雲は、しばしばスパース、ノイズ、不規則である。
これらの問題に対処するため、最近の研究は別々に行われ、不正確な点雲を密度化、復調し、完全な不正確な点雲を観測している。
本研究では,1) 初期密度化とデノナイズのための3次元スパース集積時間ガラスネットワーク,2) 離散ボクセルを3Dポイントに変換するトランスフォーマーによる改良,の2段階からなる深部点雲再構成ネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T07:53:28Z) - Learning point embedding for 3D data processing [2.12121796606941]
現在の点ベース法は本質的に空間関係処理ネットワークである。
PE-Netは高次元空間における点雲の表現を学習する。
実験によると、PE-Netは複数の挑戦的なデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-07-19T00:25:28Z) - Compositional Prototype Network with Multi-view Comparision for Few-Shot
Point Cloud Semantic Segmentation [47.0611707526858]
完全に教師ありのポイントクラウドセグメンテーションネットワークは、しばしばポイントワイズアノテーションを持つ大量のデータを必要とする。
少数のラベル付きトレーニングデータだけでポイントクラウドのセグメンテーションを行うことができるコンポジションプロトタイプネットワークを紹介します。
画像中の少数の学習文献にインスパイアされたネットワークは、限られたトレーニングデータから予測のためのラベルのないテストデータに直接ラベル情報を転送します。
論文 参考訳(メタデータ) (2020-12-28T15:01:34Z) - Dense-Resolution Network for Point Cloud Classification and Segmentation [42.316932316581635]
DRNetは、異なる解像度でポイントクラウドからローカルポイント機能を学ぶように設計されている。
広く使われているポイントクラウドセグメンテーションと分類ベンチマークでネットワークを検証することに加えて、コンポーネントのパフォーマンスをテストし視覚化する。
論文 参考訳(メタデータ) (2020-05-14T06:13:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。