論文の概要: 3DGTN: 3D Dual-Attention GLocal Transformer Network for Point Cloud
Classification and Segmentation
- arxiv url: http://arxiv.org/abs/2209.11255v2
- Date: Wed, 31 May 2023 02:20:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 04:19:50.807228
- Title: 3DGTN: 3D Dual-Attention GLocal Transformer Network for Point Cloud
Classification and Segmentation
- Title(参考訳): 3DGTN:ポイントクラウド分類とセグメンテーションのための3次元デュアルアタッチメントGLocal Transformer Network
- Authors: Dening Lu, Kyle Gao, Qian Xie, Linlin Xu, Jonathan Li
- Abstract要約: 本稿では,Global Local(GLocal) Transformer Network(3DGTN)と呼ばれる,新たなポイントクラウド表現学習ネットワークを提案する。
提案するフレームワークは,分類データセットとセグメンテーションデータセットの両方で評価される。
- 参考スコア(独自算出の注目度): 21.054928631088575
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Although the application of Transformers in 3D point cloud processing has
achieved significant progress and success, it is still challenging for existing
3D Transformer methods to efficiently and accurately learn both valuable global
features and valuable local features for improved applications. This paper
presents a novel point cloud representational learning network, called 3D Dual
Self-attention Global Local (GLocal) Transformer Network (3DGTN), for improved
feature learning in both classification and segmentation tasks, with the
following key contributions. First, a GLocal Feature Learning (GFL) block with
the dual self-attention mechanism (i.e., a novel Point-Patch Self-Attention,
called PPSA, and a channel-wise self-attention) is designed to efficiently
learn the GLocal context information. Second, the GFL block is integrated with
a multi-scale Graph Convolution-based Local Feature Aggregation (LFA) block,
leading to a Global-Local (GLocal) information extraction module that can
efficiently capture critical information. Third, a series of GLocal modules are
used to construct a new hierarchical encoder-decoder structure to enable the
learning of "GLocal" information in different scales in a hierarchical manner.
The proposed framework is evaluated on both classification and segmentation
datasets, demonstrating that the proposed method is capable of outperforming
many state-of-the-art methods on both classification and segmentation tasks.
- Abstract(参考訳): 3Dポイントクラウド処理におけるTransformerの適用は、大きな進歩と成功を達成しているが、既存の3D Transformerメソッドが、価値あるグローバル機能と改善されたアプリケーションに有用なローカル機能の両方を効率的に正確に学習することは、依然として困難である。
本稿では,3D Dual Self-attention Global Local (GLocal) Transformer Network (3DGTN) と呼ばれる新しいポイントクラウド表現学習ネットワークを提案する。
まず、gローカルな特徴学習(gfl)ブロックにおいて、gローカルな文脈情報を効率的に学習するように設計する(すなわち、ppsaと呼ばれる新しいポイントパッチ・セルフ・アテンションとチャネルワイズ・セルフアテンション)。
第2に、gflブロックは、多スケールグラフ畳み込みに基づく局所特徴集約(lfa)ブロックと統合され、臨界情報を効率的にキャプチャできるグローバルローカル(glocal)情報抽出モジュールとなる。
第3に、一連のGLocalモジュールを使用して新しい階層エンコーダデコーダ構造を構築し、階層的な方法で異なるスケールでの"GLOCAL"情報の学習を可能にする。
提案手法は,分類とセグメンテーションの両方のデータセット上で評価され,分類とセグメンテーションの両方において最先端の手法を上回ることができることを示した。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - PotholeGuard: A Pothole Detection Approach by Point Cloud Semantic
Segmentation [0.0]
3Dセマンティック・ポトホールの研究は、しばしば点雲の空間性を見落とし、最適な局所的な特徴のキャプチャとセグメンテーションの精度をもたらす。
本モデルでは,隠れた特徴を効率よく同定し,局所特性を高めるためにフィードバック機構を用いる。
弊社のアプローチは、堅牢で正確な3Dポットホールセグメンテーション(pothole segmentation)のための有望なソリューションを提供する。
論文 参考訳(メタデータ) (2023-11-05T12:57:05Z) - PointCMC: Cross-Modal Multi-Scale Correspondences Learning for Point
Cloud Understanding [0.875967561330372]
自己教師付きポイントクラウド表現学習のためのマルチスケール対応をモダリティ間でモデル化するクロスモーダル手法
ポイントCMCは,(1) 局所的局所幾何学的特徴を最適化して局所的対応を学習する局所的-局所的(L2L)モジュール,(2) 局所的-グローバル的(L2G)モジュール,(3) 局所的-グローバル的(G2G)モジュール,(3) 局所的雲と画像間の協調的大域的コントラスト損失を利用して高レベルの意味的対応を学習するグローバル的(G2G)モジュールから構成される。
論文 参考訳(メタデータ) (2022-11-22T06:08:43Z) - LCPFormer: Towards Effective 3D Point Cloud Analysis via Local Context
Propagation in Transformers [60.51925353387151]
本稿では,近隣地域間のメッセージパッシングを活用するために,LCP (Local Context Propagation) という新しいモジュールを提案する。
隣接するローカル領域の重複点を仲介として使用した後、異なるローカルリージョンからの共有ポイントの特徴を再重み付けし、その後、次のレイヤに渡す。
提案手法は, 異なるタスクに適用可能であり, 3次元形状分類や高密度予測タスクを含むベンチマークにおいて, 様々なトランスフォーマーベースの手法より優れる。
論文 参考訳(メタデータ) (2022-10-23T15:43:01Z) - LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD [13.907586081922345]
本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
論文 参考訳(メタデータ) (2022-10-12T02:11:00Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - L2G: A Simple Local-to-Global Knowledge Transfer Framework for Weakly
Supervised Semantic Segmentation [67.26984058377435]
高品質なオブジェクトアテンションマイニングのための簡易なローカル・グローバルな知識伝達フレームワークであるL2Gについて述べる。
本フレームワークは,グローバルな視点から収集したリッチオブジェクトの詳細知識をグローバルネットワークで学習する。
実験の結果,PASCAL VOC 2012とMS COCO 2014の検証セットにおいて,72.1%,44.2%のmIoU値が得られた。
論文 参考訳(メタデータ) (2022-04-07T04:31:32Z) - 3DCTN: 3D Convolution-Transformer Network for Point Cloud Classification [23.0009969537045]
本稿では,ポイントクラウド分類のためのTransformerとの畳み込みを取り入れた,新しい階層型フレームワークを提案する。
本手法は精度と効率の両面で最先端の分類性能を実現する。
論文 参考訳(メタデータ) (2022-03-02T02:42:14Z) - PIG-Net: Inception based Deep Learning Architecture for 3D Point Cloud
Segmentation [0.9137554315375922]
そこで我々はPIG-Netと呼ばれるインセプションに基づくディープネットワークアーキテクチャを提案し,点雲の局所的および大域的幾何学的詳細を効果的に特徴付ける。
我々は2つの最先端データセット上でPIG-Netアーキテクチャの徹底的な実験的解析を行う。
論文 参考訳(メタデータ) (2021-01-28T13:27:55Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。