論文の概要: SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation
- arxiv url: http://arxiv.org/abs/2209.05924v1
- Date: Tue, 13 Sep 2022 12:12:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-14 12:59:13.640894
- Title: SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation
- Title(参考訳): SVNet:SO(3)等分散がポイントクラウド表現のバイナリ化に遭遇する
- Authors: Zhuo Su and Max Welling and Matti pietik\"ainen and Li Liu
- Abstract要約: 本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
- 参考スコア(独自算出の注目度): 65.4396959244269
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Efficiency and robustness are increasingly needed for applications on 3D
point clouds, with the ubiquitous use of edge devices in scenarios like
autonomous driving and robotics, which often demand real-time and reliable
responses. The paper tackles the challenge by designing a general framework to
construct 3D learning architectures with SO(3) equivariance and network
binarization. However, a naive combination of equivariant networks and
binarization either causes sub-optimal computational efficiency or geometric
ambiguity. We propose to locate both scalar and vector features in our networks
to avoid both cases. Precisely, the presence of scalar features makes the major
part of the network binarizable, while vector features serve to retain rich
structural information and ensure SO(3) equivariance. The proposed approach can
be applied to general backbones like PointNet and DGCNN. Meanwhile, experiments
on ModelNet40, ShapeNet, and the real-world dataset ScanObjectNN, demonstrated
that the method achieves a great trade-off between efficiency, rotation
robustness, and accuracy. The codes are available at
https://github.com/zhuoinoulu/svnet.
- Abstract(参考訳): 自動運転やロボット工学のような、リアルタイムで信頼性の高い応答を必要とするシナリオでは、エッジデバイスがユビキタスに使われているため、3dポイントクラウド上のアプリケーションでは、効率性と堅牢性がますます必要になっている。
本稿では,SO(3)等分散とネットワークバイナライゼーションによる3次元学習アーキテクチャ構築のための汎用フレームワークを設計することで,課題に対処する。
しかし、同変ネットワークと双対化のナイーブな組み合わせは、準最適計算効率または幾何学的曖昧性を引き起こす。
我々は,ネットワーク内のスカラー特徴とベクトル特徴の両方を特定し,両方のケースを避けることを提案する。
正確には、スカラー特徴の存在はネットワークの大部分をバイナリズ可能とし、ベクトル特徴は豊富な構造情報を保持し、SO(3)同値性を保証する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
一方、ModelNet40、ShapeNet、および実世界のデータセットScanObjectNNの実験では、この手法が効率、回転ロバスト性、精度の間の大きなトレードオフを達成することを示した。
コードはhttps://github.com/zhuoinoulu/svnetで入手できる。
関連論文リスト
- Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - Training or Architecture? How to Incorporate Invariance in Neural
Networks [14.162739081163444]
本稿では,グループ行動に関して,ネットワークアーキテクチャを確実に不変化する手法を提案する。
簡単に言えば、実際のネットワークにデータを送る前に、可能なトランスフォーメーションを“無効化”するつもりです。
このような手法の特性を解析し、等変ネットワークに拡張し、その利点を頑健さと計算効率の両面からいくつかの数値例で示す。
論文 参考訳(メタデータ) (2021-06-18T10:31:00Z) - SALA: Soft Assignment Local Aggregation for Parameter Efficient 3D
Semantic Segmentation [65.96170587706148]
3dポイントクラウドセマンティクスセグメンテーションのためのパラメータ効率の良いネットワークを生成するポイントローカルアグリゲーション関数の設計に着目する。
グリッド型アグリゲーション関数における学習可能な隣り合わせソフトアロケーションの利用について検討する。
論文 参考訳(メタデータ) (2020-12-29T20:16:37Z) - SpinNet: Learning a General Surface Descriptor for 3D Point Cloud
Registration [57.28608414782315]
ローカルな特徴を抽出するために、SpinNetと呼ばれる新しい、概念的にはシンプルで、ニューラルなアーキテクチャを導入する。
屋内と屋外の両方の実験では、SpinNetが既存の最先端技術より優れていることが示されている。
論文 参考訳(メタデータ) (2020-11-24T15:00:56Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z) - Gram Regularization for Multi-view 3D Shape Retrieval [3.655021726150368]
本稿では,グラム正規化という新しい正規化用語を提案する。
重みカーネル間の分散を強要することにより、正規化器は識別的特徴を抽出するのに役立つ。
提案したグラム正規化はデータ独立であり、ベルやホイッスルを使わずに安定かつ迅速に収束することができる。
論文 参考訳(メタデータ) (2020-11-16T05:37:24Z) - FADNet: A Fast and Accurate Network for Disparity Estimation [18.05392578461659]
本研究では,FADNetという分散度推定のための効率的かつ高精度なディープネットワークを提案する。
高速な計算を保存するために、2Dベースの効率的な相関層と積み重ねブロックを利用する。
精度を向上させるために、マルチスケールの重みスケジューリングトレーニング技術を活用するために、マルチスケールの予測を含んでいる。
論文 参考訳(メタデータ) (2020-03-24T10:27:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。