Fugu-MT 論文翻訳(概要): PDO-s3DCNNs: Partial Differential Operator Based Steerable 3D CNNs

論文の概要: PDO-s3DCNNs: Partial Differential Operator Based Steerable 3D CNNs

arxiv url: http://arxiv.org/abs/2208.03720v1
Date: Sun, 7 Aug 2022 13:37:29 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-09 13:28:01.775131
Title: PDO-s3DCNNs: Partial Differential Operator Based Steerable 3D CNNs
Title（参考訳）: pdo-s3dcnns:偏微分作用素に基づく3次元cnn
Authors: Zhengyang Shen, Tao Hong, Qi She, Jinwen Ma, Zhouchen Lin
Abstract要約: 本研究では、3Dフィルタをモデル化するために偏微分演算子(PDO)を用い、PDO-s3DCNNと呼ばれる一般的な3D CNNを導出する。等変フィルタは線形制約の対象であり, 様々な条件下で効率的に解けることを示す。
参考スコア（独自算出の注目度）: 69.85869748832127
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Steerable models can provide very general and flexible equivariance by formulating equivariance requirements in the language of representation theory and feature fields, which has been recognized to be effective for many vision tasks. However, deriving steerable models for 3D rotations is much more difficult than that in the 2D case, due to more complicated mathematics of 3D rotations. In this work, we employ partial differential operators (PDOs) to model 3D filters, and derive general steerable 3D CNNs, which are called PDO-s3DCNNs. We prove that the equivariant filters are subject to linear constraints, which can be solved efficiently under various conditions. As far as we know, PDO-s3DCNNs are the most general steerable CNNs for 3D rotations, in the sense that they cover all common subgroups of $SO(3)$ and their representations, while existing methods can only be applied to specific groups and representations. Extensive experiments show that our models can preserve equivariance well in the discrete domain, and outperform previous works on SHREC'17 retrieval and ISBI 2012 segmentation tasks with a low network complexity.
Abstract（参考訳）: ステアブルモデルは、表現論と特徴体の言語における同値要件を定式化することによって、非常に一般的で柔軟な等式を提供できる。しかし、3次元回転のより複雑な数学のために、3次元回転のステアブルモデルを導出することは2次元回転よりもずっと難しい。本研究では、3Dフィルタをモデル化するために偏微分演算子(PDO)を用い、PDO-s3DCNNと呼ばれる一般的な3D CNNを導出する。等変フィルタは線形制約の対象であり, 様々な条件下で効率的に解けることを示す。我々の知る限り、PDO-s3DCNNは3次元回転のための最も一般的な操舵可能なCNNであり、それらは$SO(3)$とその表現のすべての共通部分群をカバーしているが、既存のメソッドは特定のグループや表現にのみ適用できる。また,SHREC'17検索やISBI 2012セグメンテーションタスクにおいて,ネットワークの複雑さを低く抑えながら,従来よりも優れた結果が得られることを示した。

関連論文リスト

Efficient Continuous Group Convolutions for Local SE(3) Equivariance in 3D Point Clouds [5.659343611352998]
ポイントクラウド処理のための効率的で連続的で局所的なSE(3)同変畳み込み層を提案する。提案手法は,オブジェクト分類やセマンティックセグメンテーションなど,さまざまなデータセットやタスクの競合や優れたパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-02-11T12:15:56Z)
MeshConv3D: Efficient convolution and pooling operators for triangular 3D meshes [0.0]
MeshConv3Dは、特殊な畳み込みとフェース崩壊ベースのプール演算子を統合する、3Dメッシュ専用手法である。 3つの異なるベンチマークデータセットで得られた実験結果から,提案手法により,同等あるいは優れた分類結果が得られることが示された。
論文参考訳（メタデータ） (2025-01-07T14:41:26Z)
3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文参考訳（メタデータ） (2024-11-01T12:50:38Z)
Exploiting the Complementarity of 2D and 3D Networks to Address Domain-Shift in 3D Semantic Segmentation [14.30113021974841]
3Dセマンティックセグメンテーションは、自律運転、ロボット工学、混合現実など、多くの現実世界のアプリケーションにおいて重要なタスクである。可能な解決策は、3D情報とRGBカメラのような異なるモダリティを特徴とするセンサーから得られる他の情報とを組み合わせることである。最近のマルチモーダルな3Dセマンティックセグメンテーションネットワークは、2D情報と3D情報を独立に処理する2つのブランチに依存してこれらのモダリティを利用する。
論文参考訳（メタデータ） (2023-04-06T10:59:43Z)
SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。 ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文参考訳（メタデータ） (2022-09-13T12:12:19Z)
Group Shift Pointwise Convolution for Volumetric Medical Image Segmentation [31.72090839643412]
本稿では,3次元畳み込みの有効性と効率を向上させるために,GSP-Conv(Group Shift Pointwise Convolution)を提案する。 GSP-Convは1x1x1カーネルで3D畳み込みをポイントワイズに単純化し、モデルパラメータやFLOPの数を劇的に削減する。以上の結果から,本手法は3次元畳み込みモデルと同等あるいはそれ以上の性能が得られた。
論文参考訳（メタデータ） (2021-09-26T15:27:33Z)
Asymmetric 3D Context Fusion for Universal Lesion Detection [55.61873234187917]
3Dネットワークは、3Dコンテキストでは強いが、教師付き事前トレーニングがない。既存の3Dコンテキスト融合演算子は空間対称に設計されており、畳み込みのように各2Dスライス上で同一の操作を行う。本研究では, 異なる重みを持つ非対称な3次元コンテキスト融合演算子 (A3D) を提案し, 異なる2次元スライスから3次元コンテキストを融合させる。
論文参考訳（メタデータ） (2021-09-17T16:25:10Z)
PDO-e$\text{S}^\text{2}$CNNs: Partial Differential Operator Based Equivariant Spherical CNNs [77.53203546732664]
我々は偏微分演算子を用いて球等価CNN, PDO-e$textStext2$CNNを設計する。実験では、pdo-e$textstext2$cnnsはパラメータ効率が高く、いくつかのタスクで他の球面cnnを大きく上回る。
論文参考訳（メタデータ） (2021-04-08T07:54:50Z)
Equivariant Point Network for 3D Point Cloud Analysis [17.689949017410836]
点雲解析のための実効的で実用的なSE(3)(3次元翻訳と回転)同変ネットワークを提案する。まず,6次元の畳み込みを2つの分離可能な畳み込み作用素に分解する新しい枠組みであるSE(3)分離点畳み込みを提案する。第2に,同変特徴の表現性を効果的に活用するアテンション層を導入する。
論文参考訳（メタデータ） (2021-03-25T21:57:10Z)
Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。 ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文参考訳（メタデータ） (2021-02-01T20:58:45Z)
Learning Equivariant Representations [10.745691354609738]
畳み込みニューラルネットワーク(CNN)はこの原理の成功例である。対称性の群で定義される異なる変換に対する同変モデルを提案する。これらのモデルはデータの対称性を利用して、サンプルとモデルの複雑さを減らし、一般化性能を向上させる。
論文参考訳（メタデータ） (2020-12-04T18:46:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。