論文の概要: 3DPCT: 3D Point Cloud Transformer with Dual Self-attention
- arxiv url: http://arxiv.org/abs/2209.11255v1
- Date: Wed, 21 Sep 2022 14:34:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 16:43:23.710982
- Title: 3DPCT: 3D Point Cloud Transformer with Dual Self-attention
- Title(参考訳): 3DPCT:デュアル自己注意型3Dポイントクラウドトランス
- Authors: Dening Lu, Kyle Gao, Qian Xie, Linlin Xu, Jonathan Li
- Abstract要約: 本稿では,Dual Self-attention(DPCT)を用いた新しいポイントクラウド表現学習ネットワークである3Dポイントクラウドトランスを提案する。
提案手法は,分類タスクと分割タスクの両方において最先端の結果を得た。
- 参考スコア(独自算出の注目度): 21.054928631088575
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Transformers have resulted in remarkable achievements in the field of image
processing. Inspired by this great success, the application of Transformers to
3D point cloud processing has drawn more and more attention. This paper
presents a novel point cloud representational learning network, 3D Point Cloud
Transformer with Dual Self-attention (3DPCT) and an encoder-decoder structure.
Specifically, 3DPCT has a hierarchical encoder, which contains two local-global
dual-attention modules for the classification task (three modules for the
segmentation task), with each module consisting of a Local Feature Aggregation
(LFA) block and a Global Feature Learning (GFL) block. The GFL block is dual
self-attention, with both point-wise and channel-wise self-attention to improve
feature extraction. Moreover, in LFA, to better leverage the local information
extracted, a novel point-wise self-attention model, named as Point-Patch
Self-Attention (PPSA), is designed. The performance is evaluated on both
classification and segmentation datasets, containing both synthetic and
real-world data. Extensive experiments demonstrate that the proposed method
achieved state-of-the-art results on both classification and segmentation
tasks.
- Abstract(参考訳): トランスフォーマーは画像処理の分野で顕著な成果を上げている。
この大きな成功にインスパイアされたTransformerの3Dポイントクラウド処理への応用は、ますます注目を集めている。
本稿では,新しい点クラウド表現学習ネットワークである3dポイントクラウドトランスフォーマ(3dpct)とエンコーダ・デコーダ構造を提案する。
具体的には、3dpctは階層的エンコーダを持ち、分類タスクのための2つのローカルグローバルデュアルアテンションモジュール(セグメンテーションタスクのための3つのモジュール)と、各モジュールがローカルフィーチャーアグリゲーション(lfa)ブロックとグローバルフィーチャー学習(gfl)ブロックで構成される。
GFLブロックは、特徴抽出を改善するために、ポイントワイドとチャンネルワイドの両方の自己アテンションを持つ二重自己アテンションである。
さらに、LFAにおいて、抽出したローカル情報をよりよく活用するために、ポイント・パッチ・セルフ・アテンション(PPSA)と呼ばれる新しいポイントワイド・セルフアテンション・モデルが設計されている。
性能は、合成データと実世界データの両方を含む分類データセットとセグメンテーションデータセットの両方で評価される。
広範な実験により,提案手法は分類と分割作業の両方において最先端の結果を得た。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - PotholeGuard: A Pothole Detection Approach by Point Cloud Semantic
Segmentation [0.0]
3Dセマンティック・ポトホールの研究は、しばしば点雲の空間性を見落とし、最適な局所的な特徴のキャプチャとセグメンテーションの精度をもたらす。
本モデルでは,隠れた特徴を効率よく同定し,局所特性を高めるためにフィードバック機構を用いる。
弊社のアプローチは、堅牢で正確な3Dポットホールセグメンテーション(pothole segmentation)のための有望なソリューションを提供する。
論文 参考訳(メタデータ) (2023-11-05T12:57:05Z) - PointCMC: Cross-Modal Multi-Scale Correspondences Learning for Point
Cloud Understanding [0.875967561330372]
自己教師付きポイントクラウド表現学習のためのマルチスケール対応をモダリティ間でモデル化するクロスモーダル手法
ポイントCMCは,(1) 局所的局所幾何学的特徴を最適化して局所的対応を学習する局所的-局所的(L2L)モジュール,(2) 局所的-グローバル的(L2G)モジュール,(3) 局所的-グローバル的(G2G)モジュール,(3) 局所的雲と画像間の協調的大域的コントラスト損失を利用して高レベルの意味的対応を学習するグローバル的(G2G)モジュールから構成される。
論文 参考訳(メタデータ) (2022-11-22T06:08:43Z) - LCPFormer: Towards Effective 3D Point Cloud Analysis via Local Context
Propagation in Transformers [60.51925353387151]
本稿では,近隣地域間のメッセージパッシングを活用するために,LCP (Local Context Propagation) という新しいモジュールを提案する。
隣接するローカル領域の重複点を仲介として使用した後、異なるローカルリージョンからの共有ポイントの特徴を再重み付けし、その後、次のレイヤに渡す。
提案手法は, 異なるタスクに適用可能であり, 3次元形状分類や高密度予測タスクを含むベンチマークにおいて, 様々なトランスフォーマーベースの手法より優れる。
論文 参考訳(メタデータ) (2022-10-23T15:43:01Z) - LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD [13.907586081922345]
本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
論文 参考訳(メタデータ) (2022-10-12T02:11:00Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - L2G: A Simple Local-to-Global Knowledge Transfer Framework for Weakly
Supervised Semantic Segmentation [67.26984058377435]
高品質なオブジェクトアテンションマイニングのための簡易なローカル・グローバルな知識伝達フレームワークであるL2Gについて述べる。
本フレームワークは,グローバルな視点から収集したリッチオブジェクトの詳細知識をグローバルネットワークで学習する。
実験の結果,PASCAL VOC 2012とMS COCO 2014の検証セットにおいて,72.1%,44.2%のmIoU値が得られた。
論文 参考訳(メタデータ) (2022-04-07T04:31:32Z) - 3DCTN: 3D Convolution-Transformer Network for Point Cloud Classification [23.0009969537045]
本稿では,ポイントクラウド分類のためのTransformerとの畳み込みを取り入れた,新しい階層型フレームワークを提案する。
本手法は精度と効率の両面で最先端の分類性能を実現する。
論文 参考訳(メタデータ) (2022-03-02T02:42:14Z) - PIG-Net: Inception based Deep Learning Architecture for 3D Point Cloud
Segmentation [0.9137554315375922]
そこで我々はPIG-Netと呼ばれるインセプションに基づくディープネットワークアーキテクチャを提案し,点雲の局所的および大域的幾何学的詳細を効果的に特徴付ける。
我々は2つの最先端データセット上でPIG-Netアーキテクチャの徹底的な実験的解析を行う。
論文 参考訳(メタデータ) (2021-01-28T13:27:55Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。