Fugu-MT 論文翻訳(概要): Efficient 3D affinely equivariant CNNs with adaptive fusion of augmented spherical Fourier-Bessel bases

論文の概要: Efficient 3D affinely equivariant CNNs with adaptive fusion of augmented spherical Fourier-Bessel bases

arxiv url: http://arxiv.org/abs/2402.16825v4
Date: Wed, 11 Dec 2024 04:10:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-12 23:20:26.288243
Title: Efficient 3D affinely equivariant CNNs with adaptive fusion of augmented spherical Fourier-Bessel bases
Title（参考訳）: 拡張球状フーリエ・ベッセル基底の適応融合による高効率3次元アフィン同変CNN
Authors: Wenzhao Zhao, Steffen Albert, Barbara D. Wichtmann, Angelika Maurer, Ulrike Attenberger, Frank G. Zöllner, Jürgen Hesser,
Abstract要約: フィルタ分解に基づく群同変畳み込みニューラルネットワーク (CNN) は, 3次元画像特徴抽出において有望な安定性とデータ効率を示した。本稿では,容積画像に対する非パラメータ共有連続3次元アフィン群同変ニューラルネットワークを提案する。
参考スコア（独自算出の注目度）: 0.36122488107441414
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Filter-decomposition-based group equivariant convolutional neural networks (CNNs) have shown promising stability and data efficiency for 3D image feature extraction. However, these networks, which rely on parameter sharing and discrete transformation groups, often underperform in modern deep neural network architectures for processing volumetric images, such as the common 3D medical images. To address these limitations, this paper presents an efficient non-parameter-sharing continuous 3D affine group equivariant neural network for volumetric images. This network uses an adaptive aggregation of Monte Carlo augmented spherical Fourier-Bessel filter bases to improve the efficiency and flexibility of 3D group equivariant CNNs for volumetric data. Unlike existing methods that focus only on angular orthogonality in filter bases, the introduced spherical Bessel Fourier filter base incorporates both angular and radial orthogonality to improve feature extraction. Experiments on four medical image segmentation datasets show that the proposed methods achieve better affine group equivariance and superior segmentation accuracy than existing 3D group equivariant convolutional neural network layers, significantly improving the training stability and data efficiency of conventional CNN layers (at 0.05 significance level). The code is available at https://github.com/ZhaoWenzhao/WMCSFB.
Abstract（参考訳）: フィルタ分解に基づく群同変畳み込みニューラルネットワーク (CNN) は, 3次元画像特徴抽出において有望な安定性とデータ効率を示した。しかしながら、パラメータ共有や離散変換グループに依存するこれらのネットワークは、一般的な3D医療画像のようなボリューム画像を処理するために、現代のディープニューラルネットワークアーキテクチャでは性能が劣ることが多い。これらの制約に対処するために,ボリューム画像に対する非パラメータ共有連続3次元アフィン群同変ニューラルネットワークを提案する。このネットワークは,モンテカルロの球面フーリエ・ベッセルフィルタの適応アグリゲーションを用いて,体積データに対する3次元群同変CNNの効率と柔軟性を向上させる。フィルタ基底における角直交のみに焦点をあてる既存の方法とは異なり、導入された球状ベッセルフーリエフィルタ基底は角直交と半径直交の両方を取り入れて特徴抽出を改善する。 4つの医用画像セグメンテーションデータセットを用いて実験したところ,提案手法は既存の3次元群同変畳み込みニューラルネットワーク層よりも優れたアフィン群同値と優れたセグメンテーション精度を実現し,従来のCNN層のトレーニング安定性とデータ効率を著しく向上させる(0.05レベル)。コードはhttps://github.com/ZhaoWenzhao/WMCSFBで公開されている。

関連論文リスト

Dynamic 3D KAN Convolution with Adaptive Grid Optimization for Hyperspectral Image Classification [12.168520751389622]
Kanetは改良された3D-DenseNetモデルであり、3D Kan Convとアダプティブグリッド更新機構で構成されている。 Kanetはネットワークの深さや幅を増大させることなく、3D動的専門家畳み込みシステムを通じてモデル表現能力を向上させる。提案手法は、IN, UP, KSCデータセット上での優れた性能を示し、主流のハイパースペクトル画像分類手法よりも優れた性能を示す。
論文参考訳（メタデータ） (2025-04-21T14:57:48Z)
3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文参考訳（メタデータ） (2024-11-01T12:50:38Z)
LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。 LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文参考訳（メタデータ） (2024-07-13T16:09:45Z)
On the Fourier analysis in the SO(3) space : EquiLoPO Network [2.7624021966289605]
既存のディープラーニングアプローチでは、離散的な回転に制限されたグループ畳み込みネットワークまたは制約付きフィルタ構造を持つステアブル畳み込みネットワークを利用する。本研究は, 連続SO(3)群における局所パターン配向に対する解析的等価性を実現する, 新たな同変ニューラルネットワークアーキテクチャを提案する。本稿では,これらの操作をResNetスタイルのアーキテクチャに統合することにより,従来の手法の限界を克服するモデルを提案する。
論文参考訳（メタデータ） (2024-04-24T16:54:39Z)
NeuRBF: A Neural Fields Representation with Adaptive Radial Basis Functions [93.02515761070201]
本稿では,信号表現に一般放射状基底を用いる新しいタイプのニューラルネットワークを提案する。提案手法は, 空間適応性が高く, ターゲット信号により密着可能な, フレキシブルなカーネル位置と形状を持つ一般ラジアルベース上に構築する。ニューラルラジアンス場再構成に適用した場合,本手法はモデルサイズが小さく,訓練速度が同等である最先端のレンダリング品質を実現する。
論文参考訳（メタデータ） (2023-09-27T06:32:05Z)
Regular SE(3) Group Convolutions for Volumetric Medical Image Analysis [10.406659081400354]
連続的なSO(3)(回転)カーネルと空間的カーネルに分離されたSE(3)群畳み込みカーネルを考案する。提案手法は,通常のCNNに比べて最大16.5%の精度向上を実現している。
論文参考訳（メタデータ） (2023-06-24T13:29:54Z)
NeRF-GAN Distillation for Efficient 3D-Aware Generation with Convolutions [97.27105725738016]
GAN(Generative Adversarial Networks)のようなニューラルラジアンスフィールド(NeRF)と生成モデルの統合は、単一ビュー画像から3D認識生成を変換した。提案手法は,ポーズ条件付き畳み込みネットワークにおいて,事前学習したNeRF-GANの有界遅延空間を再利用し,基礎となる3次元表現に対応する3D一貫性画像を直接生成する手法である。
論文参考訳（メタデータ） (2023-03-22T18:59:48Z)
Leveraging SO(3)-steerable convolutions for pose-robust semantic segmentation in 3D medical data [2.207533492015563]
球面調和に基づく同変ボクセル畳み込みを用いたセグメンテーションネットワークを新たに提案する。これらのネットワークは、トレーニング中に見えないデータポーズに対して堅牢であり、トレーニング中にローテーションベースのデータ拡張を必要としない。 MRI脳腫瘍におけるセグメンテーション性能と健常な脳構造セグメンテーション課題について検討した。
論文参考訳（メタデータ） (2023-03-01T09:27:08Z)
Moving Frame Net: SE(3)-Equivariant Network for Volumes [0.0]
移動フレームアプローチに基づく画像データのための回転・変換同変ニューラルネットワークを提案する。入力段階において、移動フレームの計算を1つに減らし、そのアプローチを大幅に改善する。我々の訓練されたモデルは、MedMNIST3Dの試験されたデータセットの大部分の医療ボリューム分類において、ベンチマークを上回ります。
論文参考訳（メタデータ） (2022-11-07T10:25:38Z)
Two-Stream Graph Convolutional Network for Intra-oral Scanner Image Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。 TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文参考訳（メタデータ） (2022-04-19T10:41:09Z)
CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文参考訳（メタデータ） (2021-03-04T13:34:22Z)
Spherical Transformer: Adapting Spherical Signal to CNNs [53.18482213611481]
Spherical Transformerは、球状信号を標準CNNで直接処理できるベクトルに変換できます。我々は,球面MNIST認識,3次元オブジェクト分類,全方向画像セマンティックセグメンテーションの課題に対するアプローチを評価する。
論文参考訳（メタデータ） (2021-01-11T12:33:16Z)
TSGCNet: Discriminative Geometric Feature Learning with Two-Stream GraphConvolutional Network for 3D Dental Model Segmentation [141.2690520327948]
2流グラフ畳み込みネットワーク(TSGCNet)を提案し、異なる幾何学的特性から多視点情報を学ぶ。 3次元口腔内スキャナーで得られた歯科モデルのリアルタイムデータセットを用いてTSGCNetの評価を行った。
論文参考訳（メタデータ） (2020-12-26T08:02:56Z)
Learning Hybrid Representations for Automatic 3D Vessel Centerline Extraction [57.74609918453932]
3次元医用画像からの血管の自動抽出は血管疾患の診断に不可欠である。既存の方法では、3次元画像からそのような細い管状構造を分割する際に、抽出された容器の不連続に悩まされることがある。抽出された船舶の連続性を維持するためには、地球的幾何学を考慮に入れる必要があると論じる。この課題を解決するためのハイブリッド表現学習手法を提案します。
論文参考訳（メタデータ） (2020-12-14T05:22:49Z)
3D Solid Spherical Bispectrum CNNs for Biomedical Texture Analysis [3.579867431007686]
局所回転不変量 (LRI) 演算子は生物医学的テクスチャ解析において大きな可能性を示している。浅層畳み込みニューラルネットワーク(CNN)に埋め込まれたLRI層の設計におけるスペクトル上の双スペクトルを用いた3次元画像解析の利点について検討する。
論文参考訳（メタデータ） (2020-04-28T09:01:13Z)
Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文参考訳（メタデータ） (2020-04-21T13:40:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。