論文の概要: Two Heads are Better than One: Geometric-Latent Attention for Point
Cloud Classification and Segmentation
- arxiv url: http://arxiv.org/abs/2111.00231v1
- Date: Sat, 30 Oct 2021 11:20:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 06:30:13.524485
- Title: Two Heads are Better than One: Geometric-Latent Attention for Point
Cloud Classification and Segmentation
- Title(参考訳): 2つの頭は1より優れている:ポイントクラウド分類とセグメンテーションのための幾何学的レイテンシー
- Authors: Hanz Cuevas-Velasquez, Antonio Javier Gallego, Robert B. Fisher
- Abstract要約: 本稿では,幾何学的特徴と潜在的特徴を組み合わせて3次元シーンを意味のある部分集合に分割する,革新的な2頭部アテンション層を提案する。
各ヘッドは、幾何学的特徴または潜在的特徴のいずれかを用いて、局所的およびグローバルな情報を組み合わせて、この情報を使用して、より良い局所的関係を学習する。
- 参考スコア(独自算出の注目度): 10.2254921311882
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present an innovative two-headed attention layer that combines geometric
and latent features to segment a 3D scene into semantically meaningful subsets.
Each head combines local and global information, using either the geometric or
latent features, of a neighborhood of points and uses this information to learn
better local relationships. This Geometric-Latent attention layer (Ge-Latto) is
combined with a sub-sampling strategy to capture global features. Our method is
invariant to permutation thanks to the use of shared-MLP layers, and it can
also be used with point clouds with varying densities because the local
attention layer does not depend on the neighbor order. Our proposal is simple
yet robust, which allows it to achieve competitive results in the ShapeNetPart
and ModelNet40 datasets, and the state-of-the-art when segmenting the complex
dataset S3DIS, with 69.2% IoU on Area 5, and 89.7% overall accuracy using
K-fold cross-validation on the 6 areas.
- Abstract(参考訳): 3dシーンを意味的に意味のある部分集合に分割するために,幾何学的特徴と潜伏特徴を組み合わせた,革新的な双方向注意層を提案する。
各ヘッドは、各点の幾何学的特徴または潜在的な特徴を用いて、局所的および大域的な情報を結合し、この情報を用いて、より良い局所的関係を学ぶ。
この幾何学的相対的注意層(ge-latto)は、グローバル特徴を捉えるためのサブサンプリング戦略と組み合わせられる。
本手法は共有MLP層の利用により置換に不変であり,局所的な注意層は近傍の順序に依存しないため,密度の異なる点雲でも使用することができる。
提案手法は単純かつ堅牢であり,shapenetpart と modelnet40 のデータセットにおいて,領域 5 の 69.2% iou と 6 領域の k-fold クロスバリデーションを用いた 89.7% という,複雑なデータセット s3dis のセグメンテーションにおいて,競合的な結果が得られる。
関連論文リスト
- GeoSpark: Sparking up Point Cloud Segmentation with Geometry Clue [25.747471104753426]
GeoSparkは、ネットワークに幾何学的ヒントを組み込んだプラグインモジュールで、機能学習とダウンサンプリングを起動する。
機能集約のために、GeoSparkはローカルポイントと近隣の幾何学的パーティションの両方からネットワークを学習することで改善する。
GeoSparkは、幾何学的分割情報を使用して、ユニークな特徴を持つポイントが保存され、冗長なポイントが融合されるダウンサンプリングプロセスを導く。
論文 参考訳(メタデータ) (2023-03-14T23:30:46Z) - Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。
従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。
本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-20T07:10:14Z) - PolarMOT: How Far Can Geometric Relations Take Us in 3D Multi-Object
Tracking? [62.997667081978825]
グラフのノードとして3D検出を符号化し、グラフエッジ上の局所極座標を用いてオブジェクト間の空間的および時間的対関係を符号化する。
これにより、グラフニューラルネットワークは、時間的および空間的相互作用を効果的に符号化することができる。
我々はnuScenesデータセット上に新しい最先端のデータセットを構築し、さらに重要なことに、私たちの手法であるPolarMOTが、異なる場所にわたって驚くほどよく一般化されていることを示す。
論文 参考訳(メタデータ) (2022-08-03T10:06:56Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - CGS-Net: Aggregating Colour, Geometry and Semantic Features for
Large-Scale Indoor Place Recognition [6.156387608994791]
大規模屋内位置認識へのアプローチとして,低レベルな色と幾何学的特徴を高レベルなセマンティック特徴で集約する手法を提案する。
我々は、RGBポイントクラウドを取り込み、ローカル機能を5つの3次元カーネルポイント畳み込み層で抽出するディープラーニングネットワークを使用している。
具体的には、セマンティックセグメンテーションタスク上でKPConv層をトレーニングし、抽出したローカル機能がセマンティックに意味があることを保証する。
論文 参考訳(メタデータ) (2022-02-04T10:51:25Z) - GraNet: Global Relation-aware Attentional Network for ALS Point Cloud
Classification [7.734726150561088]
ALS点群のセマンティックラベリングに着目した新しいニューラルネットワークを提案する。
GraNetは局所幾何学的記述と局所依存性を学習する。
2つのALSポイントクラウドデータセット上で実験を行った。
論文 参考訳(メタデータ) (2020-12-24T23:54:45Z) - Learning Geometry-Disentangled Representation for Complementary
Understanding of 3D Object Point Cloud [50.56461318879761]
3次元画像処理のためのGDANet(Geometry-Disentangled Attention Network)を提案する。
GDANetは、点雲を3Dオブジェクトの輪郭と平らな部分に切り離し、それぞれ鋭い変化成分と穏やかな変化成分で表される。
3Dオブジェクトの分類とセグメンテーションベンチマークの実験は、GDANetがより少ないパラメータで最先端の処理を実現していることを示している。
論文 参考訳(メタデータ) (2020-12-20T13:35:00Z) - PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation [111.7241018610573]
私たちは、インスタンスセグメンテーションのための新しいエンドツーエンドボトムアップアーキテクチャであるPointGroupを紹介します。
我々は2分岐ネットワークを設計し、ポイントの特徴を抽出し、セマンティックラベルとオフセットを予測し、各ポイントをそれぞれのインスタンスセントロイドに向けてシフトさせる。
クラスタリングコンポーネントは、元のおよびオフセットシフトされた点座標セットの両方を利用するために、その相補的な強度を利用する。
ScanNet v2 と S3DIS の2つの挑戦的データセットに対する広範な実験を行い、ScanNet v2 と S3DIS が最も高い性能を達成し、63.6% と 64.0% の2つを以前のベストが達成した54.9% と54.4% と比較した。
論文 参考訳(メタデータ) (2020-04-03T16:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。