論文の概要: PDO-s3DCNNs: Partial Differential Operator Based Steerable 3D CNNs
- arxiv url: http://arxiv.org/abs/2208.03720v1
- Date: Sun, 7 Aug 2022 13:37:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-09 13:28:01.775131
- Title: PDO-s3DCNNs: Partial Differential Operator Based Steerable 3D CNNs
- Title(参考訳): pdo-s3dcnns:偏微分作用素に基づく3次元cnn
- Authors: Zhengyang Shen, Tao Hong, Qi She, Jinwen Ma, Zhouchen Lin
- Abstract要約: 本研究では、3Dフィルタをモデル化するために偏微分演算子(PDO)を用い、PDO-s3DCNNと呼ばれる一般的な3D CNNを導出する。
等変フィルタは線形制約の対象であり, 様々な条件下で効率的に解けることを示す。
- 参考スコア(独自算出の注目度): 69.85869748832127
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Steerable models can provide very general and flexible equivariance by
formulating equivariance requirements in the language of representation theory
and feature fields, which has been recognized to be effective for many vision
tasks. However, deriving steerable models for 3D rotations is much more
difficult than that in the 2D case, due to more complicated mathematics of 3D
rotations. In this work, we employ partial differential operators (PDOs) to
model 3D filters, and derive general steerable 3D CNNs, which are called
PDO-s3DCNNs. We prove that the equivariant filters are subject to linear
constraints, which can be solved efficiently under various conditions. As far
as we know, PDO-s3DCNNs are the most general steerable CNNs for 3D rotations,
in the sense that they cover all common subgroups of $SO(3)$ and their
representations, while existing methods can only be applied to specific groups
and representations. Extensive experiments show that our models can preserve
equivariance well in the discrete domain, and outperform previous works on
SHREC'17 retrieval and ISBI 2012 segmentation tasks with a low network
complexity.
- Abstract(参考訳): ステアブルモデルは、表現論と特徴体の言語における同値要件を定式化することによって、非常に一般的で柔軟な等式を提供できる。
しかし、3次元回転のより複雑な数学のために、3次元回転のステアブルモデルを導出することは2次元回転よりもずっと難しい。
本研究では、3Dフィルタをモデル化するために偏微分演算子(PDO)を用い、PDO-s3DCNNと呼ばれる一般的な3D CNNを導出する。
等変フィルタは線形制約の対象であり, 様々な条件下で効率的に解けることを示す。
我々の知る限り、PDO-s3DCNNは3次元回転のための最も一般的な操舵可能なCNNであり、それらは$SO(3)$とその表現のすべての共通部分群をカバーしているが、既存のメソッドは特定のグループや表現にのみ適用できる。
また,SHREC'17検索やISBI 2012セグメンテーションタスクにおいて,ネットワークの複雑さを低く抑えながら,従来よりも優れた結果が得られることを示した。
関連論文リスト
- Efficient Continuous Group Convolutions for Local SE(3) Equivariance in 3D Point Clouds [5.659343611352998]
ポイントクラウド処理のための効率的で連続的で局所的なSE(3)同変畳み込み層を提案する。
提案手法は,オブジェクト分類やセマンティックセグメンテーションなど,さまざまなデータセットやタスクの競合や優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-02-11T12:15:56Z) - MeshConv3D: Efficient convolution and pooling operators for triangular 3D meshes [0.0]
MeshConv3Dは、特殊な畳み込みとフェース崩壊ベースのプール演算子を統合する、3Dメッシュ専用手法である。
3つの異なるベンチマークデータセットで得られた実験結果から,提案手法により,同等あるいは優れた分類結果が得られることが示された。
論文 参考訳(メタデータ) (2025-01-07T14:41:26Z) - 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - Asymmetric 3D Context Fusion for Universal Lesion Detection [55.61873234187917]
3Dネットワークは、3Dコンテキストでは強いが、教師付き事前トレーニングがない。
既存の3Dコンテキスト融合演算子は空間対称に設計されており、畳み込みのように各2Dスライス上で同一の操作を行う。
本研究では, 異なる重みを持つ非対称な3次元コンテキスト融合演算子 (A3D) を提案し, 異なる2次元スライスから3次元コンテキストを融合させる。
論文 参考訳(メタデータ) (2021-09-17T16:25:10Z) - PDO-e$\text{S}^\text{2}$CNNs: Partial Differential Operator Based
Equivariant Spherical CNNs [77.53203546732664]
我々は偏微分演算子を用いて球等価CNN, PDO-e$textStext2$CNNを設計する。
実験では、pdo-e$textstext2$cnnsはパラメータ効率が高く、いくつかのタスクで他の球面cnnを大きく上回る。
論文 参考訳(メタデータ) (2021-04-08T07:54:50Z) - Equivariant Point Network for 3D Point Cloud Analysis [17.689949017410836]
点雲解析のための実効的で実用的なSE(3)(3次元翻訳と回転)同変ネットワークを提案する。
まず,6次元の畳み込みを2つの分離可能な畳み込み作用素に分解する新しい枠組みであるSE(3)分離点畳み込みを提案する。
第2に,同変特徴の表現性を効果的に活用するアテンション層を導入する。
論文 参考訳(メタデータ) (2021-03-25T21:57:10Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z) - Learning Equivariant Representations [10.745691354609738]
畳み込みニューラルネットワーク(CNN)はこの原理の成功例である。
対称性の群で定義される異なる変換に対する同変モデルを提案する。
これらのモデルはデータの対称性を利用して、サンプルとモデルの複雑さを減らし、一般化性能を向上させる。
論文 参考訳(メタデータ) (2020-12-04T18:46:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。