論文の概要: Multi-scale Geometry-aware Transformer for 3D Point Cloud Classification
- arxiv url: http://arxiv.org/abs/2304.05694v1
- Date: Wed, 12 Apr 2023 08:34:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 15:39:38.355783
- Title: Multi-scale Geometry-aware Transformer for 3D Point Cloud Classification
- Title(参考訳): 3次元点雲分類のための多次元形状認識トランス
- Authors: Xian Wei, Muyu Wang, Shing-Ho Jonathan Lin, Zhengyu Li, Jian Yang,
Arafat Al-Jawari, Xuan Tang
- Abstract要約: 本稿では,その変種であるMulti-scale Geometry-Aware Transformer (MGT)を用いた自己注意型プラグインモジュールを提案する。
MGTは、以下の3つの側面において、マルチスケールの局所的および大域的幾何学的情報をポイントクラウドデータとして処理する。
実験の結果,MGTは自己認識機構を用いてマルチスケール幾何を捕捉する能力を大幅に向上させることが示された。
- 参考スコア(独自算出の注目度): 17.836838702265332
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-attention modules have demonstrated remarkable capabilities in capturing
long-range relationships and improving the performance of point cloud tasks.
However, point cloud objects are typically characterized by complex,
disordered, and non-Euclidean spatial structures with multiple scales, and
their behavior is often dynamic and unpredictable. The current self-attention
modules mostly rely on dot product multiplication and dimension alignment among
query-key-value features, which cannot adequately capture the multi-scale
non-Euclidean structures of point cloud objects. To address these problems,
this paper proposes a self-attention plug-in module with its variants,
Multi-scale Geometry-aware Transformer (MGT). MGT processes point cloud data
with multi-scale local and global geometric information in the following three
aspects. At first, the MGT divides point cloud data into patches with multiple
scales. Secondly, a local feature extractor based on sphere mapping is proposed
to explore the geometry inner each patch and generate a fixed-length
representation for each patch. Thirdly, the fixed-length representations are
fed into a novel geodesic-based self-attention to capture the global
non-Euclidean geometry between patches. Finally, all the modules are integrated
into the framework of MGT with an end-to-end training scheme. Experimental
results demonstrate that the MGT vastly increases the capability of capturing
multi-scale geometry using the self-attention mechanism and achieves strong
competitive performance on mainstream point cloud benchmarks.
- Abstract(参考訳): セルフアテンションモジュールは、長距離リレーションシップをキャプチャし、ポイントクラウドタスクのパフォーマンスを改善する際、顕著な機能を示した。
しかし、点雲天体は、複雑で無秩序で非ユークリッド的な空間構造によって特徴づけられ、その振る舞いは、しばしば動的で予測不能である。
現在のセルフアテンションモジュールは主にドット積乗法とクエリキー値の特徴間の次元アライメントに依存しており、ポイントクラウドオブジェクトのマルチスケール非ユークリッド構造を適切に捉えることはできない。
これらの問題に対処するため,本研究では,多スケール幾何対応トランス (MGT) を用いた自己注意型プラグインモジュールを提案する。
MGTは、以下の3つの側面において、マルチスケールの局所的および大域的幾何学的情報をポイントクラウドデータとして処理する。
MGTは最初、ポイントクラウドデータを複数のスケールのパッチに分割する。
次に,各パッチの内部形状を探索し,各パッチに対して固定長表現を生成するために,球面マッピングに基づく局所特徴抽出器を提案する。
第三に、固定長表現は、パッチ間のグローバルな非ユークリッド幾何学を捉えるために、新しい測地線に基づく自己アテンションに供給される。
最後に、すべてのモジュールはエンドツーエンドのトレーニングスキームでMGTのフレームワークに統合されます。
実験の結果,MGTは自己保持機構を用いてマルチスケールの幾何を捕捉する能力を大幅に向上し,主流のクラウドベンチマーク上での強力な競争性能を実現することが示された。
関連論文リスト
- Bridging Domain Gap of Point Cloud Representations via Self-Supervised Geometric Augmentation [15.881442863961531]
領域間の点雲表現の幾何学的不変性を誘導する新しいスキームを提案する。
一方、点雲のセントロイドシフトを軽減するために、拡張サンプルの距離の変換を予測するための新しいプレテキストタスクが提案されている。
一方,我々は幾何学的に拡張された点雲上での自己教師付き関係学習の統合を開拓した。
論文 参考訳(メタデータ) (2024-09-11T02:39:19Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Self-supervised 3D Point Cloud Completion via Multi-view Adversarial Learning [61.14132533712537]
我々は、オブジェクトレベルとカテゴリ固有の幾何学的類似性の両方を効果的に活用するフレームワークであるMAL-SPCを提案する。
私たちのMAL-SPCは3Dの完全な監視を一切必要とせず、各オブジェクトに1つの部分点クラウドを必要とするだけです。
論文 参考訳(メタデータ) (2024-07-13T06:53:39Z) - PointeNet: A Lightweight Framework for Effective and Efficient Point
Cloud Analysis [28.54939134635978]
PointeNetは、ポイントクラウド分析に特化したネットワークである。
本手法は,分類/分割ヘッドとシームレスに統合したり,市販の3Dオブジェクト検出ネットワークに埋め込んだりすることで,柔軟性を示す。
ModelNet40、ScanObjectNN、ShapeNet KITTI、およびシーンレベルのデータセットKITTIを含むオブジェクトレベルのデータセットの実験は、ポイントクラウド分析における最先端メソッドよりもPointeNetの方が優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-12-20T03:34:48Z) - Variational Relational Point Completion Network for Robust 3D
Classification [59.80993960827833]
可変点雲補完法は、局所的な詳細を欠くため、大域的な形状の骨格を生成する傾向がある。
本稿では2つの魅力的な特性を持つ変分フレームワークであるポイントコンプリートネットワーク(VRCNet)を提案する。
VRCNetは、現実世界のポイントクラウドスキャンにおいて、非常に一般化性と堅牢性を示している。
論文 参考訳(メタデータ) (2023-04-18T17:03:20Z) - MetaSets: Meta-Learning on Point Sets for Generalizable Representations [100.5981809166658]
本稿では,3次元領域一般化(DDG)の新たな課題について検討し,学習過程においてそれらにアクセスすることなく,他の目に見えない点雲の領域にモデルを一般化することを目的とする。
本稿ではメタセットを用いてこの問題に対処することを提案する。メタ学習は、慎重に設計された変換された点集合上の分類タスク群からポイントクラウド表現を抽出する。
実験結果から,MetaSetsは既存の3次元深層学習手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-04-15T03:24:39Z) - IDEA-Net: Dynamic 3D Point Cloud Interpolation via Deep Embedding
Alignment [58.8330387551499]
我々は、点方向軌跡(すなわち滑らかな曲線)の推定として問題を定式化する。
本稿では,学習した時間的一貫性の助けを借りて問題を解消する,エンドツーエンドのディープラーニングフレームワークであるIDEA-Netを提案する。
各種点群における本手法の有効性を実証し, 定量的かつ視覚的に, 最先端の手法に対する大幅な改善を観察する。
論文 参考訳(メタデータ) (2022-03-22T10:14:08Z) - DFC: Deep Feature Consistency for Robust Point Cloud Registration [0.4724825031148411]
複雑なアライメントシーンのための学習に基づくアライメントネットワークを提案する。
我々は,3DMatchデータセットとKITTIオドメトリデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2021-11-15T08:27:21Z) - PoinTr: Diverse Point Cloud Completion with Geometry-Aware Transformers [81.71904691925428]
本稿では,ポイントクラウドの完了をセット・ツー・セットの翻訳問題として再定義する手法を提案する。
我々はまた、ポイントクラウド補完のためにトランスフォーマーエンコーダデコーダアーキテクチャを採用するPoinTrと呼ばれる新しいモデルも設計している。
提案手法は,新しいベンチマークと既存ベンチマークの両方において,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T17:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。