論文の概要: TetraSphere: A Neural Descriptor for O(3)-Invariant Point Cloud Analysis
- arxiv url: http://arxiv.org/abs/2211.14456v5
- Date: Fri, 8 Mar 2024 16:14:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 23:43:53.359073
- Title: TetraSphere: A Neural Descriptor for O(3)-Invariant Point Cloud Analysis
- Title(参考訳): TetraSphere: O(3)-不変点雲解析のためのニューラルネットワーク記述子
- Authors: Pavlo Melnyk, Andreas Robinson, Michael Felsberg, M{\aa}rten
Wadenb\"ack
- Abstract要約: 我々は3次元回転と反射、すなわちO(3)作用の下で学習可能な記述子不変量を示す。
本研究では, 3次元球面ニューロンを4次元ベクトルニューロンに埋め込み, モデルのエンドツーエンドトレーニングを活用することを提案する。
以上の結果から,3次元ユークリッド空間で学習する3次元球状ニューロンの実用的価値が明らかとなった。
- 参考スコア(独自算出の注目度): 17.503340572243058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many practical applications, 3D point cloud analysis requires rotation
invariance. In this paper, we present a learnable descriptor invariant under 3D
rotations and reflections, i.e., the O(3) actions, utilizing the recently
introduced steerable 3D spherical neurons and vector neurons. Specifically, we
propose an embedding of the 3D spherical neurons into 4D vector neurons, which
leverages end-to-end training of the model. In our approach, we perform
TetraTransform--an equivariant embedding of the 3D input into 4D, constructed
from the steerable neurons--and extract deeper O(3)-equivariant features using
vector neurons. This integration of the TetraTransform into the VN-DGCNN
framework, termed TetraSphere, negligibly increases the number of parameters by
less than 0.0002%. TetraSphere sets a new state-of-the-art performance
classifying randomly rotated real-world object scans of the challenging subsets
of ScanObjectNN. Additionally, TetraSphere outperforms all equivariant methods
on randomly rotated synthetic data: classifying objects from ModelNet40 and
segmenting parts of the ShapeNet shapes. Thus, our results reveal the practical
value of steerable 3D spherical neurons for learning in 3D Euclidean space. The
code is available at \url{https://github.com/pavlo-melnyk/tetrasphere}.
- Abstract(参考訳): 多くの実用的応用において、3次元点雲解析は回転不変性を必要とする。
本稿では,最近導入された3次元球面ニューロンとベクトルニューロンを用いた3次元回転と反射,すなわちo(3)作用下での学習可能な記述子不変性について述べる。
具体的には,3次元球面ニューロンを4次元ベクトルニューロンに埋め込み,モデルのエンドツーエンドトレーニングを活用する。
提案手法では, ステアブルニューロンから構築された3次元入力の4次元への同変埋め込みであるTetraTransformを行い, ベクトルニューロンを用いたO(3)-同変の深い特徴を抽出する。
TetraTransformのVN-DGCNNフレームワークへの統合は、TetraSphereと呼ばれ、パラメータの数を0.0002%以下にすることが無視できる。
tetrasphereは、scanobjectnnの挑戦的なサブセットのランダムに回転した実世界のオブジェクトスキャンを分類する新しい最先端のパフォーマンスを設定する。
さらに、TetraSphereは、ModelNet40からのオブジェクトの分類とShapeNet形状のセグメンテーションといった、ランダムに回転した合成データ上で、すべての同変法より優れている。
そこで本研究では,3次元ユークリッド空間で学習する3次元球状ニューロンの実用的価値を明らかにした。
コードは \url{https://github.com/pavlo-melnyk/tetrasphere} で入手できる。
関連論文リスト
- Self-supervised Learning of Rotation-invariant 3D Point Set Features
using Transformer and its Self-distillation [6.309631397879698]
本稿では,オブジェクトレベルでの高精度かつ回転不変な3次元点集合特徴を取得するための,自己教師付き学習フレームワークを提案する。
トークンを改良し,それを3次元点集合ごとに表現的回転不変の特徴に集約するために,自己認識機構を用いる。
提案アルゴリズムは,既存のアルゴリズムよりも高精度な回転不変の3次元点集合特徴を学習する。
論文 参考訳(メタデータ) (2023-08-09T06:03:07Z) - Learning Smooth Neural Functions via Lipschitz Regularization [92.42667575719048]
ニューラルフィールドにおけるスムーズな潜伏空間を促進するために設計された新しい正規化を導入する。
従来のリプシッツ正規化ネットワークと比較して、我々のアルゴリズムは高速で、4行のコードで実装できる。
論文 参考訳(メタデータ) (2022-02-16T21:24:54Z) - ConDor: Self-Supervised Canonicalization of 3D Pose for Partial Shapes [55.689763519293464]
ConDorは、完全および部分的な3次元点雲の3次元配向と位置を正準化することを学ぶ自己教師型手法である。
推測中,本手法は任意のポーズで完全あるいは部分的な3次元点の雲を抽出し,同変正則のポーズを出力する。
論文 参考訳(メタデータ) (2022-01-19T18:57:21Z) - Spatially Invariant Unsupervised 3D Object Segmentation with Graph
Neural Networks [23.729853358582506]
本研究では,空間混合モデルとして点雲をモデル化するフレームワークSPAIR3Dを提案する。
変分オートエンコーダ(VAE)を用いて3次元の多目的表現とセグメンテーションを共同で学習する。
実験の結果,SPAIR3Dは外見情報のない可変物体を検出・分割できることがわかった。
論文 参考訳(メタデータ) (2021-06-10T09:20:16Z) - Fully Steerable 3D Spherical Neurons [14.86655504533083]
本稿では,球面決定曲面からなり,点雲上で動作可能なフィードフォワード学習方式を提案する。
我々の理論の固有の幾何学的3次元構造のため、我々はその原子部分に対して3次元の操舵性制約を導出する。
モデルパラメータが推論時にどのように完全に制御可能であるかを示す。
論文 参考訳(メタデータ) (2021-06-02T16:30:02Z) - Rotation-Invariant Autoencoders for Signals on Spheres [10.406659081400354]
球面画像に対する回転不変表現の教師なし学習の問題について検討する。
特に、$S2$と$SO(3)$の畳み込み層からなるオートエンコーダアーキテクチャを設計する。
複数のデータセットの実験は、クラスタリング、検索、分類アプリケーションにおける学習された表現の有用性を示す。
論文 参考訳(メタデータ) (2020-12-08T15:15:03Z) - Cylinder3D: An Effective 3D Framework for Driving-scene LiDAR Semantic
Segmentation [87.54570024320354]
大規模運転シーンのLiDARセマンティックセマンティックセグメンテーションのための最先端の手法は、しばしば2D空間の点雲を投影して処理する。
3D-to-2Dプロジェクションの問題に取り組むための簡単な解決策は、3D表現を保ち、3D空間の点を処理することである。
我々は3次元シリンダー分割と3次元シリンダー畳み込みに基づくフレームワークをCylinder3Dとして開発し,3次元トポロジの関係と運転シーンの点雲の構造を利用する。
論文 参考訳(メタデータ) (2020-08-04T13:56:19Z) - Spin-Weighted Spherical CNNs [58.013031812072356]
球面領域を離れることなく, 異方性フィルタを効率的に行うことができる新しい球面CNNを提案する。
鍵となる考え方は、重力波の研究において物理学で導入されたスピン重み付き球面関数を考えることである。
本手法は, 球面画像の分類, 3次元形状の分類, 球面パノラマのセマンティックセグメンテーションといったタスクにおいて, 従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T17:57:21Z) - Cylindrical Convolutional Networks for Joint Object Detection and
Viewpoint Estimation [76.21696417873311]
3次元空間で定義された畳み込みカーネルの円筒形表現を利用する学習可能なモジュールである円筒型畳み込みネットワーク(CCN)を導入する。
CCNはビュー固有の畳み込みカーネルを通してビュー固有の特徴を抽出し、各視点におけるオブジェクトカテゴリスコアを予測する。
本実験は,円柱状畳み込みネットワークが関節物体の検出と視点推定に与える影響を実証する。
論文 参考訳(メタデータ) (2020-03-25T10:24:58Z) - 3D Shape Segmentation with Geometric Deep Learning [2.512827436728378]
本稿では,部分分割問題としてセグメント化全体を解くために,3次元形状の3次元拡張ビューを生成するニューラルネットワークベースのアプローチを提案する。
提案手法は,公開データセットの3次元形状と,フォトグラム法を用いて再構成した実物体を用いて検証する。
論文 参考訳(メタデータ) (2020-02-02T14:11:16Z) - Quaternion Equivariant Capsule Networks for 3D Point Clouds [58.566467950463306]
本稿では,3次元回転と翻訳に同値な点雲を処理するための3次元カプセルモジュールを提案する。
カプセル間の動的ルーティングをよく知られたWeiszfeldアルゴリズムに接続する。
オペレーターに基づいて、ポーズから幾何学をアンタングルするカプセルネットワークを構築します。
論文 参考訳(メタデータ) (2019-12-27T13:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。