Fugu-MT 論文翻訳(概要): Collect-and-Distribute Transformer for 3D Point Cloud Analysis

論文の概要: Collect-and-Distribute Transformer for 3D Point Cloud Analysis

arxiv url: http://arxiv.org/abs/2306.01257v2
Date: Tue, 31 Oct 2023 03:55:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-01 23:53:37.505844
Title: Collect-and-Distribute Transformer for 3D Point Cloud Analysis
Title（参考訳）: 3次元点雲解析のための集配変圧器
Authors: Haibo Qiu, Baosheng Yu, Dacheng Tao
Abstract要約: 本稿では,点雲の短距離・長距離コンテキストを通信するための収集・分散機構を備えた新しい変圧器ネットワークを提案する。その結果,提案したCDFormerの有効性が示され,ポイントクラウドの分類とセグメンテーションタスクにおける最先端のパフォーマンスがいくつか提供された。
参考スコア（独自算出の注目度）: 82.03517861433849
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Remarkable advancements have been made recently in point cloud analysis through the exploration of transformer architecture, but it remains challenging to effectively learn local and global structures within point clouds. In this paper, we propose a new transformer network equipped with a collect-and-distribute mechanism to communicate short- and long-range contexts of point clouds, which we refer to as CDFormer. Specifically, we first employ self-attention to capture short-range interactions within each local patch, and the updated local features are then collected into a set of proxy reference points from which we can extract long-range contexts. Afterward, we distribute the learned long-range contexts back to local points via cross-attention. To address the position clues for short- and long-range contexts, we additionally introduce the context-aware position encoding to facilitate position-aware communications between points. We perform experiments on five popular point cloud datasets, namely ModelNet40, ScanObjectNN, ShapeNetPart, S3DIS and ScanNetV2, for classification and segmentation. Results show the effectiveness of the proposed CDFormer, delivering several new state-of-the-art performances on point cloud classification and segmentation tasks. The source code is available at \url{https://github.com/haibo-qiu/CDFormer}.
Abstract（参考訳）: 変圧器アーキテクチャの探索を通じて,近年,ポイントクラウド解析が注目されているが,ポイントクラウド内の局所構造やグローバル構造を効果的に学習することは依然として困難である。本稿では,CDFormerと呼ばれる点雲の近距離・短距離コンテキストを通信するための収集・分散機構を備えた新しい変圧器ネットワークを提案する。具体的には、まず、各ローカルパッチ内の短距離インタラクションをキャプチャするために自己アテンションを使用し、更新されたローカル特徴をプロキシ参照ポイントのセットに収集し、長距離コンテキストを抽出する。その後、学習した長距離コンテキストをクロスアテンションを通じてローカルポイントに分散する。短距離および長距離の文脈における位置手がかりに対処するために,ポイント間の位置認識通信を容易にする文脈認識位置符号化を導入する。分類とセグメンテーションのために,ModelNet40,ScanObjectNN,ShapeNetPart,S3DIS,ScanNetV2の5つの人気ポイントクラウドデータセットで実験を行った。その結果,提案するcdformerの有効性が示され,ポイントクラウド分類とセグメンテーションタスクにおいて最新の性能がいくつか提供されている。ソースコードは \url{https://github.com/haibo-qiu/CDFormer} で入手できる。

関連論文リスト

Few-Shot 3D Point Cloud Semantic Segmentation via Stratified Class-Specific Attention Based Transformer Network [22.9434434107516]
数ショットのクラウドセマンティックセマンティックセグメンテーションのための新しい多層トランスフォーマーネットワークを開発した。提案手法は,既存の数ショットの3Dポイントクラウドセグメンテーションモデルよりも15%少ない推論時間で,新しい最先端性能を実現する。
論文参考訳（メタデータ） (2023-03-28T00:27:54Z)
Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文参考訳（メタデータ） (2022-11-20T07:10:14Z)
Graph Neural Network and Spatiotemporal Transformer Attention for 3D Video Object Detection from Point Clouds [94.21415132135951]
複数のフレームにおける時間情報を利用して3次元物体を検出することを提案する。我々は,一般的なアンカーベースおよびアンカーフリー検出器に基づくアルゴリズムを実装した。
論文参考訳（メタデータ） (2022-07-26T05:16:28Z)
SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文参考訳（メタデータ） (2022-05-26T17:00:23Z)
Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。 S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文参考訳（メタデータ） (2022-03-28T05:35:16Z)
Deep Point Cloud Reconstruction [74.694733918351]
3Dスキャンから得られる点雲は、しばしばスパース、ノイズ、不規則である。これらの問題に対処するため、最近の研究は別々に行われ、不正確な点雲を密度化、復調し、完全な不正確な点雲を観測している。本研究では,1) 初期密度化とデノナイズのための3次元スパース集積時間ガラスネットワーク,2) 離散ボクセルを3Dポイントに変換するトランスフォーマーによる改良,の2段階からなる深部点雲再構成ネットワークを提案する。
論文参考訳（メタデータ） (2021-11-23T07:53:28Z)
Learning point embedding for 3D data processing [2.12121796606941]
現在の点ベース法は本質的に空間関係処理ネットワークである。 PE-Netは高次元空間における点雲の表現を学習する。実験によると、PE-Netは複数の挑戦的なデータセットで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2021-07-19T00:25:28Z)
Compositional Prototype Network with Multi-view Comparision for Few-Shot Point Cloud Semantic Segmentation [47.0611707526858]
完全に教師ありのポイントクラウドセグメンテーションネットワークは、しばしばポイントワイズアノテーションを持つ大量のデータを必要とする。少数のラベル付きトレーニングデータだけでポイントクラウドのセグメンテーションを行うことができるコンポジションプロトタイプネットワークを紹介します。画像中の少数の学習文献にインスパイアされたネットワークは、限られたトレーニングデータから予測のためのラベルのないテストデータに直接ラベル情報を転送します。
論文参考訳（メタデータ） (2020-12-28T15:01:34Z)
Dense-Resolution Network for Point Cloud Classification and Segmentation [42.316932316581635]
DRNetは、異なる解像度でポイントクラウドからローカルポイント機能を学ぶように設計されている。広く使われているポイントクラウドセグメンテーションと分類ベンチマークでネットワークを検証することに加えて、コンポーネントのパフォーマンスをテストし視覚化する。
論文参考訳（メタデータ） (2020-05-14T06:13:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。