論文の概要: TetraSphere: A Neural Descriptor for O(3)-Invariant Point Cloud Analysis
- arxiv url: http://arxiv.org/abs/2211.14456v3
- Date: Sat, 9 Sep 2023 15:08:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 22:51:45.168843
- Title: TetraSphere: A Neural Descriptor for O(3)-Invariant Point Cloud Analysis
- Title(参考訳): TetraSphere: O(3)-不変点雲解析のためのニューラルネットワーク記述子
- Authors: Pavlo Melnyk, Andreas Robinson, M{\aa}rten Wadenb\"ack, Michael
Felsberg
- Abstract要約: 本研究では3次元球状ニューロンとベクトルニューロンに基づく回転・反射不変3次元点雲解析のための学習可能な記述子を提案する。
両手法の互換性を示し、エンド・ツー・エンド方式でステアブルニューロンを適用した。
以上の結果から,3次元ユークリッド空間で学習する3次元球状ニューロンの実用的価値が明らかとなった。
- 参考スコア(独自算出の注目度): 17.503340572243058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rotation invariance is an important requirement for the analysis of 3D point
clouds. In this paper, we present a learnable descriptor for rotation- and
reflection-invariant 3D point cloud analysis based on recently introduced
steerable 3D spherical neurons and vector neurons. Specifically, we show the
compatibility of the two approaches and apply steerable neurons in an
end-to-end method, which both constitute the technical novelty. In our
approach, we perform TetraTransform -- which lifts the 3D input to an
equivariant 4D representation, constructed by the steerable neurons -- and
extract deeper rotation-equivariant features using vector neurons. This
integration of the TetraTransform into the VN-DGCNN framework, termed
TetraSphere, inexpensively increases the number of parameters by less than
0.0007%. Taking only points as input, TetraSphere sets a new state-of-the-art
performance classifying randomly rotated real-world object scans of the hardest
subset of ScanObjectNN, even when trained on data without additional rotation
augmentation. Additionally, TetraSphere demonstrates the second-best
performance segmenting parts of the synthetic ShapeNet, consistently
outperforming the baseline VN-DGCNN. All in all, our results reveal the
practical value of steerable 3D spherical neurons for learning in 3D Euclidean
space.
- Abstract(参考訳): 回転不変性は3次元点雲の解析において重要な要件である。
本稿では,最近導入された3次元球状ニューロンとベクトルニューロンに基づく回転・反射不変3次元点雲解析のための学習可能な記述子を提案する。
具体的には、両手法の互換性を示し、両手法とも技術的新奇性を構成するエンドツーエンド方式でステアブルニューロンを適用する。
提案手法では, ステアブルニューロンによって構築された同変4次元表現に3次元入力を持ち上げるテトラ変換を行い, ベクトルニューロンを用いてより深い回転同変特徴を抽出する。
TetraTransformのVN-DGCNNフレームワークへの統合は、TetraSphereと呼ばれ、パラメータの数を0.0007%未満で安価に増加させる。
TetraSphereは、入力ポイントのみを考慮し、ScanObjectNNの最も難しいサブセットをランダムに回転させた実世界のオブジェクトスキャンを、追加のローテーション拡張なしでトレーニングした場合でも、新しい最先端のパフォーマンスを分類する。
さらに、TetraSphereは、合成ShapeNetの2番目のパフォーマンスセグメンテーション部分を示し、ベースラインのVN-DGCNNを一貫して上回っている。
その結果,3次元ユークリッド空間で学習する3次元球面ニューロンの実用的有用性が明らかになった。
関連論文リスト
- 3D Geometry-aware Deformable Gaussian Splatting for Dynamic View Synthesis [49.352765055181436]
動的ビュー合成のための3次元幾何学的変形可能なガウススメッティング法を提案する。
提案手法は,動的ビュー合成と3次元動的再構成を改良した3次元形状認識変形モデリングを実現する。
論文 参考訳(メタデータ) (2024-04-09T12:47:30Z) - Parameterization-driven Neural Surface Reconstruction for Object-oriented Editing in Neural Rendering [35.69582529609475]
本稿では,ニューラル暗黙表面を球面やポリキューブのような単純なパラメトリック領域にパラメータ化するための新しいニューラルアルゴリズムを提案する。
オブジェクトのゼロレベルセットからの前方マッピングと後方マッピングのための逆変形を用いて、オブジェクトとドメイン間の双方向の変形を計算する。
本手法の有効性を人間の頭部と人工物の画像に示す。
論文 参考訳(メタデータ) (2023-10-09T08:42:40Z) - Self-supervised Learning of Rotation-invariant 3D Point Set Features using Transformer and its Self-distillation [3.1652399282742536]
本稿では,オブジェクトレベルでの高精度かつ回転不変な3次元点集合特徴を取得するための,自己教師付き学習フレームワークを提案する。
トークンを改良し,それを3次元点集合ごとに表現的回転不変の特徴に集約するために,自己認識機構を用いる。
提案アルゴリズムは,既存のアルゴリズムよりも高精度な回転不変の3次元点集合特徴を学習する。
論文 参考訳(メタデータ) (2023-08-09T06:03:07Z) - ConDor: Self-Supervised Canonicalization of 3D Pose for Partial Shapes [55.689763519293464]
ConDorは、完全および部分的な3次元点雲の3次元配向と位置を正準化することを学ぶ自己教師型手法である。
推測中,本手法は任意のポーズで完全あるいは部分的な3次元点の雲を抽出し,同変正則のポーズを出力する。
論文 参考訳(メタデータ) (2022-01-19T18:57:21Z) - Spatially Invariant Unsupervised 3D Object Segmentation with Graph
Neural Networks [23.729853358582506]
本研究では,空間混合モデルとして点雲をモデル化するフレームワークSPAIR3Dを提案する。
変分オートエンコーダ(VAE)を用いて3次元の多目的表現とセグメンテーションを共同で学習する。
実験の結果,SPAIR3Dは外見情報のない可変物体を検出・分割できることがわかった。
論文 参考訳(メタデータ) (2021-06-10T09:20:16Z) - Fully Steerable 3D Spherical Neurons [14.86655504533083]
本稿では,球面決定曲面からなり,点雲上で動作可能なフィードフォワード学習方式を提案する。
我々の理論の固有の幾何学的3次元構造のため、我々はその原子部分に対して3次元の操舵性制約を導出する。
モデルパラメータが推論時にどのように完全に制御可能であるかを示す。
論文 参考訳(メタデータ) (2021-06-02T16:30:02Z) - Rotation-Invariant Autoencoders for Signals on Spheres [10.406659081400354]
球面画像に対する回転不変表現の教師なし学習の問題について検討する。
特に、$S2$と$SO(3)$の畳み込み層からなるオートエンコーダアーキテクチャを設計する。
複数のデータセットの実験は、クラスタリング、検索、分類アプリケーションにおける学習された表現の有用性を示す。
論文 参考訳(メタデータ) (2020-12-08T15:15:03Z) - Spin-Weighted Spherical CNNs [58.013031812072356]
球面領域を離れることなく, 異方性フィルタを効率的に行うことができる新しい球面CNNを提案する。
鍵となる考え方は、重力波の研究において物理学で導入されたスピン重み付き球面関数を考えることである。
本手法は, 球面画像の分類, 3次元形状の分類, 球面パノラマのセマンティックセグメンテーションといったタスクにおいて, 従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T17:57:21Z) - Cylindrical Convolutional Networks for Joint Object Detection and
Viewpoint Estimation [76.21696417873311]
3次元空間で定義された畳み込みカーネルの円筒形表現を利用する学習可能なモジュールである円筒型畳み込みネットワーク(CCN)を導入する。
CCNはビュー固有の畳み込みカーネルを通してビュー固有の特徴を抽出し、各視点におけるオブジェクトカテゴリスコアを予測する。
本実験は,円柱状畳み込みネットワークが関節物体の検出と視点推定に与える影響を実証する。
論文 参考訳(メタデータ) (2020-03-25T10:24:58Z) - V4D:4D Convolutional Neural Networks for Video-level Representation
Learning [58.548331848942865]
映像表現学習用3D CNNの多くはクリップベースであるため,映像時間進化は考慮していない。
4D畳み込みを伴う長距離表現をモデル化するために,ビデオレベル4Dコナールニューラルネットワーク(V4D)を提案する。
V4Dは、最近の3D CNNよりも大きなマージンで優れた結果を得る。
論文 参考訳(メタデータ) (2020-02-18T09:27:41Z) - Quaternion Equivariant Capsule Networks for 3D Point Clouds [58.566467950463306]
本稿では,3次元回転と翻訳に同値な点雲を処理するための3次元カプセルモジュールを提案する。
カプセル間の動的ルーティングをよく知られたWeiszfeldアルゴリズムに接続する。
オペレーターに基づいて、ポーズから幾何学をアンタングルするカプセルネットワークを構築します。
論文 参考訳(メタデータ) (2019-12-27T13:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。