論文の概要: Efficient 3D affinely equivariant CNNs with adaptive fusion of augmented spherical Fourier-Bessel bases
- arxiv url: http://arxiv.org/abs/2402.16825v4
- Date: Wed, 11 Dec 2024 04:10:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 13:59:19.299334
- Title: Efficient 3D affinely equivariant CNNs with adaptive fusion of augmented spherical Fourier-Bessel bases
- Title(参考訳): 拡張球状フーリエ・ベッセル基底の適応融合による高効率3次元アフィン同変CNN
- Authors: Wenzhao Zhao, Steffen Albert, Barbara D. Wichtmann, Angelika Maurer, Ulrike Attenberger, Frank G. Zöllner, Jürgen Hesser,
- Abstract要約: フィルタ分解に基づく群同変畳み込みニューラルネットワーク (CNN) は, 3次元画像特徴抽出において有望な安定性とデータ効率を示した。
本稿では,容積画像に対する非パラメータ共有連続3次元アフィン群同変ニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 0.36122488107441414
- License:
- Abstract: Filter-decomposition-based group equivariant convolutional neural networks (CNNs) have shown promising stability and data efficiency for 3D image feature extraction. However, these networks, which rely on parameter sharing and discrete transformation groups, often underperform in modern deep neural network architectures for processing volumetric images, such as the common 3D medical images. To address these limitations, this paper presents an efficient non-parameter-sharing continuous 3D affine group equivariant neural network for volumetric images. This network uses an adaptive aggregation of Monte Carlo augmented spherical Fourier-Bessel filter bases to improve the efficiency and flexibility of 3D group equivariant CNNs for volumetric data. Unlike existing methods that focus only on angular orthogonality in filter bases, the introduced spherical Bessel Fourier filter base incorporates both angular and radial orthogonality to improve feature extraction. Experiments on four medical image segmentation datasets show that the proposed methods achieve better affine group equivariance and superior segmentation accuracy than existing 3D group equivariant convolutional neural network layers, significantly improving the training stability and data efficiency of conventional CNN layers (at 0.05 significance level). The code is available at https://github.com/ZhaoWenzhao/WMCSFB.
- Abstract(参考訳): フィルタ分解に基づく群同変畳み込みニューラルネットワーク (CNN) は, 3次元画像特徴抽出において有望な安定性とデータ効率を示した。
しかしながら、パラメータ共有や離散変換グループに依存するこれらのネットワークは、一般的な3D医療画像のようなボリューム画像を処理するために、現代のディープニューラルネットワークアーキテクチャでは性能が劣ることが多い。
これらの制約に対処するために,ボリューム画像に対する非パラメータ共有連続3次元アフィン群同変ニューラルネットワークを提案する。
このネットワークは,モンテカルロの球面フーリエ・ベッセルフィルタの適応アグリゲーションを用いて,体積データに対する3次元群同変CNNの効率と柔軟性を向上させる。
フィルタ基底における角直交のみに焦点をあてる既存の方法とは異なり、導入された球状ベッセルフーリエフィルタ基底は角直交と半径直交の両方を取り入れて特徴抽出を改善する。
4つの医用画像セグメンテーションデータセットを用いて実験したところ,提案手法は既存の3次元群同変畳み込みニューラルネットワーク層よりも優れたアフィン群同値と優れたセグメンテーション精度を実現し,従来のCNN層のトレーニング安定性とデータ効率を著しく向上させる(0.05レベル)。
コードはhttps://github.com/ZhaoWenzhao/WMCSFBで公開されている。
関連論文リスト
- On the Fourier analysis in the SO(3) space : EquiLoPO Network [2.7624021966289605]
既存のディープラーニングアプローチでは、離散的な回転に制限されたグループ畳み込みネットワークまたは制約付きフィルタ構造を持つステアブル畳み込みネットワークを利用する。
本研究は, 連続SO(3)群における局所パターン配向に対する解析的等価性を実現する, 新たな同変ニューラルネットワークアーキテクチャを提案する。
本稿では,これらの操作をResNetスタイルのアーキテクチャに統合することにより,従来の手法の限界を克服するモデルを提案する。
論文 参考訳(メタデータ) (2024-04-24T16:54:39Z) - NeuRBF: A Neural Fields Representation with Adaptive Radial Basis
Functions [93.02515761070201]
本稿では,信号表現に一般放射状基底を用いる新しいタイプのニューラルネットワークを提案する。
提案手法は, 空間適応性が高く, ターゲット信号により密着可能な, フレキシブルなカーネル位置と形状を持つ一般ラジアルベース上に構築する。
ニューラルラジアンス場再構成に適用した場合,本手法はモデルサイズが小さく,訓練速度が同等である最先端のレンダリング品質を実現する。
論文 参考訳(メタデータ) (2023-09-27T06:32:05Z) - NeRF-GAN Distillation for Efficient 3D-Aware Generation with
Convolutions [97.27105725738016]
GAN(Generative Adversarial Networks)のようなニューラルラジアンスフィールド(NeRF)と生成モデルの統合は、単一ビュー画像から3D認識生成を変換した。
提案手法は,ポーズ条件付き畳み込みネットワークにおいて,事前学習したNeRF-GANの有界遅延空間を再利用し,基礎となる3次元表現に対応する3D一貫性画像を直接生成する手法である。
論文 参考訳(メタデータ) (2023-03-22T18:59:48Z) - Leveraging SO(3)-steerable convolutions for pose-robust semantic segmentation in 3D medical data [2.207533492015563]
球面調和に基づく同変ボクセル畳み込みを用いたセグメンテーションネットワークを新たに提案する。
これらのネットワークは、トレーニング中に見えないデータポーズに対して堅牢であり、トレーニング中にローテーションベースのデータ拡張を必要としない。
MRI脳腫瘍におけるセグメンテーション性能と健常な脳構造セグメンテーション課題について検討した。
論文 参考訳(メタデータ) (2023-03-01T09:27:08Z) - Moving Frame Net: SE(3)-Equivariant Network for Volumes [0.0]
移動フレームアプローチに基づく画像データのための回転・変換同変ニューラルネットワークを提案する。
入力段階において、移動フレームの計算を1つに減らし、そのアプローチを大幅に改善する。
我々の訓練されたモデルは、MedMNIST3Dの試験されたデータセットの大部分の医療ボリューム分類において、ベンチマークを上回ります。
論文 参考訳(メタデータ) (2022-11-07T10:25:38Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - TSGCNet: Discriminative Geometric Feature Learning with Two-Stream
GraphConvolutional Network for 3D Dental Model Segmentation [141.2690520327948]
2流グラフ畳み込みネットワーク(TSGCNet)を提案し、異なる幾何学的特性から多視点情報を学ぶ。
3次元口腔内スキャナーで得られた歯科モデルのリアルタイムデータセットを用いてTSGCNetの評価を行った。
論文 参考訳(メタデータ) (2020-12-26T08:02:56Z) - 3D Solid Spherical Bispectrum CNNs for Biomedical Texture Analysis [3.579867431007686]
局所回転不変量 (LRI) 演算子は生物医学的テクスチャ解析において大きな可能性を示している。
浅層畳み込みニューラルネットワーク(CNN)に埋め込まれたLRI層の設計におけるスペクトル上の双スペクトルを用いた3次元画像解析の利点について検討する。
論文 参考訳(メタデータ) (2020-04-28T09:01:13Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。