論文の概要: RISurConv: Rotation Invariant Surface Attention-Augmented Convolutions for 3D Point Cloud Classification and Segmentation
- arxiv url: http://arxiv.org/abs/2408.06110v1
- Date: Mon, 12 Aug 2024 12:47:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-13 14:15:41.031922
- Title: RISurConv: Rotation Invariant Surface Attention-Augmented Convolutions for 3D Point Cloud Classification and Segmentation
- Title(参考訳): RISurConv: 3Dポイントクラウド分類とセグメンテーションのための回転不変表面アテンション拡張畳み込み
- Authors: Zhiyuan Zhang, Licheng Yang, Zhiyu Xiang,
- Abstract要約: 本稿では,3次元点雲の分類とセグメンテーションのための新しい効果的な回転不変アーキテクチャを提案する。
高精度を維持しつつ、任意の回転に不変な3次元点雲解析に有効なニューラルネットワークを構築した。
- 参考スコア(独自算出の注目度): 17.558376773179337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the progress on 3D point cloud deep learning, most prior works focus on learning features that are invariant to translation and point permutation, and very limited efforts have been devoted for rotation invariant property. Several recent studies achieve rotation invariance at the cost of lower accuracies. In this work, we close this gap by proposing a novel yet effective rotation invariant architecture for 3D point cloud classification and segmentation. Instead of traditional pointwise operations, we construct local triangle surfaces to capture more detailed surface structure, based on which we can extract highly expressive rotation invariant surface properties which are then integrated into an attention-augmented convolution operator named RISurConv to generate refined attention features via self-attention layers. Based on RISurConv we build an effective neural network for 3D point cloud analysis that is invariant to arbitrary rotations while maintaining high accuracy. We verify the performance on various benchmarks with supreme results obtained surpassing the previous state-of-the-art by a large margin. We achieve an overall accuracy of 96.0% (+4.7%) on ModelNet40, 93.1% (+12.8%) on ScanObjectNN, and class accuracies of 91.5% (+3.6%), 82.7% (+5.1%), and 78.5% (+9.2%) on the three categories of the FG3D dataset for the fine-grained classification task. Additionally, we achieve 81.5% (+1.0%) mIoU on ShapeNet for the segmentation task. Code is available here: https://github.com/cszyzhang/RISurConv
- Abstract(参考訳): 3Dポイントのクラウド深層学習の進歩にもかかわらず、ほとんどの先行研究は翻訳や点置換に不変な学習機能に焦点を当てており、回転不変性のために非常に限定的な努力がなされている。
いくつかの最近の研究は、低い精度で回転不変性を達成している。
本研究では、3次元点雲の分類とセグメンテーションのための新しい効果的な回転不変アーキテクチャを提案することにより、このギャップを埋める。
従来の点演算の代わりに、より詳細な表面構造を捉えるために局所三角形面を構築し、そこで高度に表現された回転不変な表面特性を抽出し、RISurConvと呼ばれる注意増強された畳み込み演算子に統合し、自己注意層を介して洗練された注意特徴を生成する。
RISurConvに基づいて、高精度を維持しながら任意の回転に不変な3Dポイントクラウド分析のための効果的なニューラルネットワークを構築します。
我々は,従来の最先端技術を上回る最高の結果を得た各種ベンチマークの性能を,大きなマージンで検証した。
ModelNet40では96.0%(+4.7%)、ScanObjectNNでは93.1%(+12.8%)、クラス精度は91.5%(+3.6%)、82.7%(+5.1%)、78.5%(+9.2%)である。
さらに、セグメント化タスクに対してShapeNet上で81.5% (+1.0%) mIoUを達成する。
コードはここにある。 https://github.com/cszyzhang/RISurConv
関連論文リスト
- ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining [104.34751911174196]
ShapeNetとModelNetを用いた大規模3DGSデータセットを構築した。
データセットのShapeSplatは、87のユニークなカテゴリから65Kのオブジェクトで構成されています。
textbftextitGaussian-MAEを導入し、ガウスパラメータからの表現学習の独特な利点を強調した。
論文 参考訳(メタデータ) (2024-08-20T14:49:14Z) - E$^3$-Net: Efficient E(3)-Equivariant Normal Estimation Network [47.77270862087191]
正規推定のための等価性を実現するために,E3-Netを提案する。
本稿では,この作業に必要なトレーニングリソースを,従来の作業の1/8に大幅に削減する,効率的なランダムフレーム手法を提案する。
提案手法は, 合成と実世界の両方のデータセットにおいて優れた結果が得られ, 最先端技術よりもかなり優れている。
論文 参考訳(メタデータ) (2024-06-01T07:53:36Z) - Clustering based Point Cloud Representation Learning for 3D Analysis [80.88995099442374]
本稿では,ポイントクラウド分析のためのクラスタリングに基づく教師付き学習手法を提案する。
現在のデファクトでシーンワイドなトレーニングパラダイムとは異なり、我々のアルゴリズムは点埋め込み空間上でクラス内のクラスタリングを行う。
我々のアルゴリズムは、有名なポイントクラウドセグメンテーションデータセットの顕著な改善を示している。
論文 参考訳(メタデータ) (2023-07-27T03:42:12Z) - HS-Pose: Hybrid Scope Feature Extraction for Category-level Object Pose
Estimation [28.405005252559146]
本稿では,3D-GCを拡張したシンプルなネットワーク構造HS層を提案する。
提案するHS層は,1)局所的グローバルな幾何学構造とグローバルな情報,2)ノイズに頑健で,3)サイズや翻訳情報をエンコードできる。
実験の結果,ベースライン法(GPV-Pose)における3D-GC層とHS層を簡易に置き換えることにより,大幅な改善が得られた。
論文 参考訳(メタデータ) (2023-03-28T05:36:42Z) - Window Normalization: Enhancing Point Cloud Understanding by Unifying
Inconsistent Point Densities [16.770190781915673]
ダウンサンプリングと特徴抽出は、3Dポイントクラウド理解に不可欠な手順である。
ウィンドウ正規化法は、異なる部分の点密度を統一するために利用される。
テクスチャや空間情報を含む多型特徴を得るためのグループワイド戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T14:09:07Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - RIConv++: Effective Rotation Invariant Convolutions for 3D Point Clouds
Deep Learning [32.18566879365623]
3Dポイントクラウドのディープラーニングは、ニューラルネットワークがポイントクラウドの機能を直接学習することのできる、有望な研究分野である。
本稿では,局所領域から強力な回転不変特徴を設計することで特徴の区別を高める,シンプルで効果的な畳み込み演算子を提案する。
ネットワークアーキテクチャは、各畳み込み層の近傍サイズを単純に調整することで、ローカルとグローバルの両方のコンテキストをキャプチャできる。
論文 参考訳(メタデータ) (2022-02-26T08:32:44Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。