論文の概要: Two Heads are Better than One: Geometric-Latent Attention for Point
Cloud Classification and Segmentation
- arxiv url: http://arxiv.org/abs/2111.00231v1
- Date: Sat, 30 Oct 2021 11:20:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 06:30:13.524485
- Title: Two Heads are Better than One: Geometric-Latent Attention for Point
Cloud Classification and Segmentation
- Title(参考訳): 2つの頭は1より優れている:ポイントクラウド分類とセグメンテーションのための幾何学的レイテンシー
- Authors: Hanz Cuevas-Velasquez, Antonio Javier Gallego, Robert B. Fisher
- Abstract要約: 本稿では,幾何学的特徴と潜在的特徴を組み合わせて3次元シーンを意味のある部分集合に分割する,革新的な2頭部アテンション層を提案する。
各ヘッドは、幾何学的特徴または潜在的特徴のいずれかを用いて、局所的およびグローバルな情報を組み合わせて、この情報を使用して、より良い局所的関係を学習する。
- 参考スコア(独自算出の注目度): 10.2254921311882
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present an innovative two-headed attention layer that combines geometric
and latent features to segment a 3D scene into semantically meaningful subsets.
Each head combines local and global information, using either the geometric or
latent features, of a neighborhood of points and uses this information to learn
better local relationships. This Geometric-Latent attention layer (Ge-Latto) is
combined with a sub-sampling strategy to capture global features. Our method is
invariant to permutation thanks to the use of shared-MLP layers, and it can
also be used with point clouds with varying densities because the local
attention layer does not depend on the neighbor order. Our proposal is simple
yet robust, which allows it to achieve competitive results in the ShapeNetPart
and ModelNet40 datasets, and the state-of-the-art when segmenting the complex
dataset S3DIS, with 69.2% IoU on Area 5, and 89.7% overall accuracy using
K-fold cross-validation on the 6 areas.
- Abstract(参考訳): 3dシーンを意味的に意味のある部分集合に分割するために,幾何学的特徴と潜伏特徴を組み合わせた,革新的な双方向注意層を提案する。
各ヘッドは、各点の幾何学的特徴または潜在的な特徴を用いて、局所的および大域的な情報を結合し、この情報を用いて、より良い局所的関係を学ぶ。
この幾何学的相対的注意層(ge-latto)は、グローバル特徴を捉えるためのサブサンプリング戦略と組み合わせられる。
本手法は共有MLP層の利用により置換に不変であり,局所的な注意層は近傍の順序に依存しないため,密度の異なる点雲でも使用することができる。
提案手法は単純かつ堅牢であり,shapenetpart と modelnet40 のデータセットにおいて,領域 5 の 69.2% iou と 6 領域の k-fold クロスバリデーションを用いた 89.7% という,複雑なデータセット s3dis のセグメンテーションにおいて,競合的な結果が得られる。
関連論文リスト
- GSTran: Joint Geometric and Semantic Coherence for Point Cloud Segmentation [33.72549134362884]
本稿では,セグメント化作業に適した新しい変圧器ネットワークであるGSTranを提案する。
提案するネットワークは主に,局所幾何学変換器と大域意味変換器の2つの主成分から構成される。
ShapeNetPartとS3DISベンチマークの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-21T12:12:37Z) - On-the-fly Point Feature Representation for Point Clouds Analysis [7.074010861305738]
そこで我々は,曲線特徴生成モジュールを通じて,豊富な幾何学的情報を明示的にキャプチャするOn-the-fly Point Feature Representation (OPFR)を提案する。
また、三角形集合に基づく局所座標系を近似した局所参照コンストラクタモジュールを導入する。
OPFRは推論に1.56ms(バニラPFHより65倍速い)と0.012M以上のパラメータしか必要とせず、様々なバックボーン用の汎用的なプラグアンドプレイモジュールとして機能する。
論文 参考訳(メタデータ) (2024-07-31T04:57:06Z) - X-3D: Explicit 3D Structure Modeling for Point Cloud Recognition [73.0588783479853]
X-3Dは明示的な3D構造モデリング手法である。
入力された3D空間内の明示的な局所構造情報をキャプチャする。
現在の局所領域内のすべての近傍点に対して共有重みを持つ動的カーネルを生成する。
論文 参考訳(メタデータ) (2024-04-23T13:15:35Z) - GeoSpark: Sparking up Point Cloud Segmentation with Geometry Clue [25.747471104753426]
GeoSparkは、ネットワークに幾何学的ヒントを組み込んだプラグインモジュールで、機能学習とダウンサンプリングを起動する。
機能集約のために、GeoSparkはローカルポイントと近隣の幾何学的パーティションの両方からネットワークを学習することで改善する。
GeoSparkは、幾何学的分割情報を使用して、ユニークな特徴を持つポイントが保存され、冗長なポイントが融合されるダウンサンプリングプロセスを導く。
論文 参考訳(メタデータ) (2023-03-14T23:30:46Z) - Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。
従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。
本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-20T07:10:14Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - GraNet: Global Relation-aware Attentional Network for ALS Point Cloud
Classification [7.734726150561088]
ALS点群のセマンティックラベリングに着目した新しいニューラルネットワークを提案する。
GraNetは局所幾何学的記述と局所依存性を学習する。
2つのALSポイントクラウドデータセット上で実験を行った。
論文 参考訳(メタデータ) (2020-12-24T23:54:45Z) - Learning Geometry-Disentangled Representation for Complementary
Understanding of 3D Object Point Cloud [50.56461318879761]
3次元画像処理のためのGDANet(Geometry-Disentangled Attention Network)を提案する。
GDANetは、点雲を3Dオブジェクトの輪郭と平らな部分に切り離し、それぞれ鋭い変化成分と穏やかな変化成分で表される。
3Dオブジェクトの分類とセグメンテーションベンチマークの実験は、GDANetがより少ないパラメータで最先端の処理を実現していることを示している。
論文 参考訳(メタデータ) (2020-12-20T13:35:00Z) - PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation [111.7241018610573]
私たちは、インスタンスセグメンテーションのための新しいエンドツーエンドボトムアップアーキテクチャであるPointGroupを紹介します。
我々は2分岐ネットワークを設計し、ポイントの特徴を抽出し、セマンティックラベルとオフセットを予測し、各ポイントをそれぞれのインスタンスセントロイドに向けてシフトさせる。
クラスタリングコンポーネントは、元のおよびオフセットシフトされた点座標セットの両方を利用するために、その相補的な強度を利用する。
ScanNet v2 と S3DIS の2つの挑戦的データセットに対する広範な実験を行い、ScanNet v2 と S3DIS が最も高い性能を達成し、63.6% と 64.0% の2つを以前のベストが達成した54.9% と54.4% と比較した。
論文 参考訳(メタデータ) (2020-04-03T16:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。