Fugu-MT 論文翻訳(概要): GPSFormer: A Global Perception and Local Structure Fitting-based Transformer for Point Cloud Understanding

論文の概要: GPSFormer: A Global Perception and Local Structure Fitting-based Transformer for Point Cloud Understanding

arxiv url: http://arxiv.org/abs/2407.13519v2
Date: Wed, 24 Jul 2024 08:23:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-25 18:12:28.345952
Title: GPSFormer: A Global Perception and Local Structure Fitting-based Transformer for Point Cloud Understanding
Title（参考訳）: GPSFormer: ポイントクラウド理解のためのグローバル知覚と局所構造適合型トランス
Authors: Changshuo Wang, Meiqing Wu, Siew-Kei Lam, Xin Ning, Shangshu Yu, Ruiping Wang, Weijun Li, Thambipillai Srikanthan,
Abstract要約: GPSFormerはGlobal Perception and Local Structure Fitting-based Transformerである。 GPSFormerは、目立った精度で点雲から詳細な形状情報を学ぶ。
参考スコア（独自算出の注目度）: 21.70950431470046
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Despite the significant advancements in pre-training methods for point cloud understanding, directly capturing intricate shape information from irregular point clouds without reliance on external data remains a formidable challenge. To address this problem, we propose GPSFormer, an innovative Global Perception and Local Structure Fitting-based Transformer, which learns detailed shape information from point clouds with remarkable precision. The core of GPSFormer is the Global Perception Module (GPM) and the Local Structure Fitting Convolution (LSFConv). Specifically, GPM utilizes Adaptive Deformable Graph Convolution (ADGConv) to identify short-range dependencies among similar features in the feature space and employs Multi-Head Attention (MHA) to learn long-range dependencies across all positions within the feature space, ultimately enabling flexible learning of contextual representations. Inspired by Taylor series, we design LSFConv, which learns both low-order fundamental and high-order refinement information from explicitly encoded local geometric structures. Integrating the GPM and LSFConv as fundamental components, we construct GPSFormer, a cutting-edge Transformer that effectively captures global and local structures of point clouds. Extensive experiments validate GPSFormer's effectiveness in three point cloud tasks: shape classification, part segmentation, and few-shot learning. The code of GPSFormer is available at \url{https://github.com/changshuowang/GPSFormer}.
Abstract（参考訳）: ポイントクラウド理解のための事前学習手法が大幅に進歩しているにもかかわらず、外部データに依存しない不規則なポイントクラウドから直接複雑な形状情報を取得することは、非常に難しい課題である。この問題に対処するために,GPSFormerを提案する。GPSFormerは革新的なグローバルパーセプションと局所構造フィッティングに基づくトランスフォーマーで,点雲からの詳細な形状情報を顕著な精度で学習する。 GPSFormerのコアはGPM(Global Perception Module)とLSFConv(Local Structure Fitting Convolution)である。具体的には、GPMはAdaptive Deformable Graph Convolution(ADGConv)を使用して、機能空間の類似した機能間の短距離依存を識別し、MHA(Multi-Head Attention)を使用して、機能空間内のすべての位置における長距離依存を学習し、最終的にコンテキスト表現の柔軟な学習を可能にする。テイラー級数に触発されてLSFConvを設計し、局所幾何学構造を明示的に符号化し、低階の基本情報と高階精製情報の両方を学習する。 GPMとLSFConvを基本コンポーネントとして、ポイントクラウドのグローバルおよびローカル構造を効果的にキャプチャする最先端のトランスフォーマーであるGPSFormerを構築した。 GPSFormerの有効性は,3点のクラウドタスク – 形状分類,部分分割,少数ショット学習 – で検証されている。 GPSFormerのコードは \url{https://github.com/changshuowang/GPSFormer} で公開されている。

関連論文リスト

PVINet: Point-Voxel Interlaced Network for Point Cloud Compression [83.74785652597248]
ポイントクラウド圧縮では、再構成されたポイントクラウドの品質は、グローバル構造とローカルコンテキストの両方に依存している。本稿では,グローバルな構造的特徴と局所的なコンテキスト的特徴を並列にキャプチャするPVINetを提案する。 PVINetは最先端の手法に比べて競争力がある。
論文参考訳（メタデータ） (2025-09-01T03:37:32Z)
Point Cloud Understanding via Attention-Driven Contrastive Learning [64.65145700121442]
トランスフォーマーベースのモデルは、自己認識機構を活用することにより、先進的なポイントクラウド理解を持つ。 PointACLは、これらの制限に対処するために設計された、注意駆動のコントラスト学習フレームワークである。本手法では, 注意駆動型動的マスキング手法を用いて, モデルが非集中領域に集中するように誘導する。
論文参考訳（メタデータ） (2024-11-22T05:41:00Z)
GSTran: Joint Geometric and Semantic Coherence for Point Cloud Segmentation [33.72549134362884]
本稿では,セグメント化作業に適した新しい変圧器ネットワークであるGSTranを提案する。提案するネットワークは主に,局所幾何学変換器と大域意味変換器の2つの主成分から構成される。 ShapeNetPartとS3DISベンチマークの実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (2024-08-21T12:12:37Z)
GeoFormer: Learning Point Cloud Completion with Tri-Plane Integrated Transformer [41.26276375114911]
ポイント・クラウド・コンプリートは、正確なグローバル・ジオメトリを復元し、部分的なポイント・クラウドからのきめ細かい局所的な詳細を保存することを目的としている。従来の手法では、3Dポイントのクラウド座標から直接見えない点を予測したり、自己投影された多視点深度マップを使用するのが一般的である。ポイントのグローバルな幾何学的構造を同時に拡張し、局所的な詳細を改善するGeoFormerを導入する。
論文参考訳（メタデータ） (2024-08-13T03:15:36Z)
Point Deformable Network with Enhanced Normal Embedding for Point Cloud Analysis [59.12922158979068]
近年,ポイントクラウド解析において高い性能を示す手法が提案されている。単純なアーキテクチャは局所的な点群で幾何学的特徴を学ぶことができるが、長距離依存を直接モデル化することができない。本稿では,表現能力の強い長距離関係を捉えるために,PDNet(Point Deformable Network)を提案する。
論文参考訳（メタデータ） (2023-12-20T14:52:07Z)
ConDaFormer: Disassembled Transformer with Local Structure Enhancement for 3D Point Cloud Understanding [105.98609765389895]
トランスフォーマーは、最近3Dポイントクラウド理解のために研究されている。 0.1万を超える多数のポイントは、ポイントクラウドデータに対してグローバルな自己注意を可能にする。本稿では,ConDaFormerという新しい変圧器ブロックを開発する。
論文参考訳（メタデータ） (2023-12-18T11:19:45Z)
TransPose: 6D Object Pose Estimation with Geometry-Aware Transformer [16.674933679692728]
TransPoseは、Transformerをジオメトリ対応モジュールで活用して、ポイントクラウドの特徴表現の学習を改善する、新しい6Dポーズフレームワークである。 TransPoseは3つのベンチマークデータセットで競合する結果を達成する。
論文参考訳（メタデータ） (2023-10-25T01:24:12Z)
Bidirectional Knowledge Reconfiguration for Lightweight Point Cloud Analysis [74.00441177577295]
ポイントクラウド分析は計算システムのオーバーヘッドに直面し、モバイルやエッジデバイスでの利用を制限する。本稿では,軽量点雲モデルのための特徴蒸留について検討する。本研究では,教師から生徒への情報的文脈的知識を抽出するための双方向知識再構成を提案する。
論文参考訳（メタデータ） (2023-10-08T11:32:50Z)
3DGTN: 3D Dual-Attention GLocal Transformer Network for Point Cloud Classification and Segmentation [21.054928631088575]
本稿では,Global Local(GLocal) Transformer Network(3DGTN)と呼ばれる,新たなポイントクラウド表現学習ネットワークを提案する。提案するフレームワークは,分類データセットとセグメンテーションデータセットの両方で評価される。
論文参考訳（メタデータ） (2022-09-21T14:34:21Z)
Bending Graphs: Hierarchical Shape Matching using Gated Optimal Transport [80.64516377977183]
形状マッチングは、コンピュータグラフィックスと視覚のコミュニティにとって長い間研究されてきた問題である。局所的なパッチレベル情報とグローバルな形状レベルの構造を組み込んだ階層型学習設計について検討する。本研究では,非信頼ノード上の特徴を逐次更新し,形状間の一貫した一致を学習することで,新しい最適輸送解法を提案する。
論文参考訳（メタデータ） (2022-02-03T11:41:46Z)
Robust Partial-to-Partial Point Cloud Registration in a Full Range [12.86951061306046]
本稿では,全方向1の部分対部分点クラウド登録(PPR)のためのポーズ不変対応を推定するグラフマッチング・コンセンサス・ネットワーク(GMCNet)を提案する。 GMCNetは、個別に各点クラウドのポイント記述子を、クロスコンテクスト情報や、トレーニングのための接地真理対応を使わずに符号化する。
論文参考訳（メタデータ） (2021-11-30T17:56:24Z)
A Rotation-Invariant Framework for Deep Point Cloud Analysis [132.91915346157018]
ネットワーク入力時に一般的な3次元カルト座標を置き換えるために,新しい低レベル純粋回転不変表現を導入する。また,これらの表現を特徴に組み込むネットワークアーキテクチャを提案し,点とその近傍の局所的関係とグローバルな形状構造を符号化する。本手法は, 形状分類, 部分分割, 形状検索を含む多点雲解析タスクにおいて評価する。
論文参考訳（メタデータ） (2020-03-16T14:04:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。