論文の概要: TetraSphere: A Neural Descriptor for O(3)-Invariant Point Cloud Analysis
- arxiv url: http://arxiv.org/abs/2211.14456v5
- Date: Fri, 8 Mar 2024 16:14:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 23:43:53.359073
- Title: TetraSphere: A Neural Descriptor for O(3)-Invariant Point Cloud Analysis
- Title(参考訳): TetraSphere: O(3)-不変点雲解析のためのニューラルネットワーク記述子
- Authors: Pavlo Melnyk, Andreas Robinson, Michael Felsberg, M{\aa}rten
Wadenb\"ack
- Abstract要約: 我々は3次元回転と反射、すなわちO(3)作用の下で学習可能な記述子不変量を示す。
本研究では, 3次元球面ニューロンを4次元ベクトルニューロンに埋め込み, モデルのエンドツーエンドトレーニングを活用することを提案する。
以上の結果から,3次元ユークリッド空間で学習する3次元球状ニューロンの実用的価値が明らかとなった。
- 参考スコア(独自算出の注目度): 17.503340572243058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many practical applications, 3D point cloud analysis requires rotation
invariance. In this paper, we present a learnable descriptor invariant under 3D
rotations and reflections, i.e., the O(3) actions, utilizing the recently
introduced steerable 3D spherical neurons and vector neurons. Specifically, we
propose an embedding of the 3D spherical neurons into 4D vector neurons, which
leverages end-to-end training of the model. In our approach, we perform
TetraTransform--an equivariant embedding of the 3D input into 4D, constructed
from the steerable neurons--and extract deeper O(3)-equivariant features using
vector neurons. This integration of the TetraTransform into the VN-DGCNN
framework, termed TetraSphere, negligibly increases the number of parameters by
less than 0.0002%. TetraSphere sets a new state-of-the-art performance
classifying randomly rotated real-world object scans of the challenging subsets
of ScanObjectNN. Additionally, TetraSphere outperforms all equivariant methods
on randomly rotated synthetic data: classifying objects from ModelNet40 and
segmenting parts of the ShapeNet shapes. Thus, our results reveal the practical
value of steerable 3D spherical neurons for learning in 3D Euclidean space. The
code is available at \url{https://github.com/pavlo-melnyk/tetrasphere}.
- Abstract(参考訳): 多くの実用的応用において、3次元点雲解析は回転不変性を必要とする。
本稿では,最近導入された3次元球面ニューロンとベクトルニューロンを用いた3次元回転と反射,すなわちo(3)作用下での学習可能な記述子不変性について述べる。
具体的には,3次元球面ニューロンを4次元ベクトルニューロンに埋め込み,モデルのエンドツーエンドトレーニングを活用する。
提案手法では, ステアブルニューロンから構築された3次元入力の4次元への同変埋め込みであるTetraTransformを行い, ベクトルニューロンを用いたO(3)-同変の深い特徴を抽出する。
TetraTransformのVN-DGCNNフレームワークへの統合は、TetraSphereと呼ばれ、パラメータの数を0.0002%以下にすることが無視できる。
tetrasphereは、scanobjectnnの挑戦的なサブセットのランダムに回転した実世界のオブジェクトスキャンを分類する新しい最先端のパフォーマンスを設定する。
さらに、TetraSphereは、ModelNet40からのオブジェクトの分類とShapeNet形状のセグメンテーションといった、ランダムに回転した合成データ上で、すべての同変法より優れている。
そこで本研究では,3次元ユークリッド空間で学習する3次元球状ニューロンの実用的価値を明らかにした。
コードは \url{https://github.com/pavlo-melnyk/tetrasphere} で入手できる。
関連論文リスト
- 3D Geometry-aware Deformable Gaussian Splatting for Dynamic View Synthesis [49.352765055181436]
動的ビュー合成のための3次元幾何学的変形可能なガウススメッティング法を提案する。
提案手法は,動的ビュー合成と3次元動的再構成を改良した3次元形状認識変形モデリングを実現する。
論文 参考訳(メタデータ) (2024-04-09T12:47:30Z) - Parameterization-driven Neural Surface Reconstruction for Object-oriented Editing in Neural Rendering [35.69582529609475]
本稿では,ニューラル暗黙表面を球面やポリキューブのような単純なパラメトリック領域にパラメータ化するための新しいニューラルアルゴリズムを提案する。
オブジェクトのゼロレベルセットからの前方マッピングと後方マッピングのための逆変形を用いて、オブジェクトとドメイン間の双方向の変形を計算する。
本手法の有効性を人間の頭部と人工物の画像に示す。
論文 参考訳(メタデータ) (2023-10-09T08:42:40Z) - Self-supervised Learning of Rotation-invariant 3D Point Set Features using Transformer and its Self-distillation [3.1652399282742536]
本稿では,オブジェクトレベルでの高精度かつ回転不変な3次元点集合特徴を取得するための,自己教師付き学習フレームワークを提案する。
トークンを改良し,それを3次元点集合ごとに表現的回転不変の特徴に集約するために,自己認識機構を用いる。
提案アルゴリズムは,既存のアルゴリズムよりも高精度な回転不変の3次元点集合特徴を学習する。
論文 参考訳(メタデータ) (2023-08-09T06:03:07Z) - ConDor: Self-Supervised Canonicalization of 3D Pose for Partial Shapes [55.689763519293464]
ConDorは、完全および部分的な3次元点雲の3次元配向と位置を正準化することを学ぶ自己教師型手法である。
推測中,本手法は任意のポーズで完全あるいは部分的な3次元点の雲を抽出し,同変正則のポーズを出力する。
論文 参考訳(メタデータ) (2022-01-19T18:57:21Z) - Spatially Invariant Unsupervised 3D Object Segmentation with Graph
Neural Networks [23.729853358582506]
本研究では,空間混合モデルとして点雲をモデル化するフレームワークSPAIR3Dを提案する。
変分オートエンコーダ(VAE)を用いて3次元の多目的表現とセグメンテーションを共同で学習する。
実験の結果,SPAIR3Dは外見情報のない可変物体を検出・分割できることがわかった。
論文 参考訳(メタデータ) (2021-06-10T09:20:16Z) - Fully Steerable 3D Spherical Neurons [14.86655504533083]
本稿では,球面決定曲面からなり,点雲上で動作可能なフィードフォワード学習方式を提案する。
我々の理論の固有の幾何学的3次元構造のため、我々はその原子部分に対して3次元の操舵性制約を導出する。
モデルパラメータが推論時にどのように完全に制御可能であるかを示す。
論文 参考訳(メタデータ) (2021-06-02T16:30:02Z) - Rotation-Invariant Autoencoders for Signals on Spheres [10.406659081400354]
球面画像に対する回転不変表現の教師なし学習の問題について検討する。
特に、$S2$と$SO(3)$の畳み込み層からなるオートエンコーダアーキテクチャを設計する。
複数のデータセットの実験は、クラスタリング、検索、分類アプリケーションにおける学習された表現の有用性を示す。
論文 参考訳(メタデータ) (2020-12-08T15:15:03Z) - Spin-Weighted Spherical CNNs [58.013031812072356]
球面領域を離れることなく, 異方性フィルタを効率的に行うことができる新しい球面CNNを提案する。
鍵となる考え方は、重力波の研究において物理学で導入されたスピン重み付き球面関数を考えることである。
本手法は, 球面画像の分類, 3次元形状の分類, 球面パノラマのセマンティックセグメンテーションといったタスクにおいて, 従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T17:57:21Z) - Cylindrical Convolutional Networks for Joint Object Detection and
Viewpoint Estimation [76.21696417873311]
3次元空間で定義された畳み込みカーネルの円筒形表現を利用する学習可能なモジュールである円筒型畳み込みネットワーク(CCN)を導入する。
CCNはビュー固有の畳み込みカーネルを通してビュー固有の特徴を抽出し、各視点におけるオブジェクトカテゴリスコアを予測する。
本実験は,円柱状畳み込みネットワークが関節物体の検出と視点推定に与える影響を実証する。
論文 参考訳(メタデータ) (2020-03-25T10:24:58Z) - V4D:4D Convolutional Neural Networks for Video-level Representation
Learning [58.548331848942865]
映像表現学習用3D CNNの多くはクリップベースであるため,映像時間進化は考慮していない。
4D畳み込みを伴う長距離表現をモデル化するために,ビデオレベル4Dコナールニューラルネットワーク(V4D)を提案する。
V4Dは、最近の3D CNNよりも大きなマージンで優れた結果を得る。
論文 参考訳(メタデータ) (2020-02-18T09:27:41Z) - Quaternion Equivariant Capsule Networks for 3D Point Clouds [58.566467950463306]
本稿では,3次元回転と翻訳に同値な点雲を処理するための3次元カプセルモジュールを提案する。
カプセル間の動的ルーティングをよく知られたWeiszfeldアルゴリズムに接続する。
オペレーターに基づいて、ポーズから幾何学をアンタングルするカプセルネットワークを構築します。
論文 参考訳(メタデータ) (2019-12-27T13:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。