論文の概要: Scale-Equivariant Deep Learning for 3D Data
- arxiv url: http://arxiv.org/abs/2304.05864v1
- Date: Wed, 12 Apr 2023 13:56:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 14:52:17.751390
- Title: Scale-Equivariant Deep Learning for 3D Data
- Title(参考訳): 3次元データのためのスケール同変深層学習
- Authors: Thomas Wimmer, Vladimir Golkov, Hoai Nam Dang, Moritz Zaiss, Andreas
Maier, Daniel Cremers
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は、画像の位置に関係なく物体を認識する。
本稿では,3次元データに対するスケール・等価な畳み込みネットワーク層を提案する。
本実験は,3次元医用画像解析の尺度等式化における提案手法の有効性を実証するものである。
- 参考スコア(独自算出の注目度): 44.52688267348063
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability of convolutional neural networks (CNNs) to recognize objects
regardless of their position in the image is due to the
translation-equivariance of the convolutional operation. Group-equivariant CNNs
transfer this equivariance to other transformations of the input. Dealing
appropriately with objects and object parts of different scale is challenging,
and scale can vary for multiple reasons such as the underlying object size or
the resolution of the imaging modality. In this paper, we propose a
scale-equivariant convolutional network layer for three-dimensional data that
guarantees scale-equivariance in 3D CNNs. Scale-equivariance lifts the burden
of having to learn each possible scale separately, allowing the neural network
to focus on higher-level learning goals, which leads to better results and
better data-efficiency. We provide an overview of the theoretical foundations
and scientific work on scale-equivariant neural networks in the two-dimensional
domain. We then transfer the concepts from 2D to the three-dimensional space
and create a scale-equivariant convolutional layer for 3D data. Using the
proposed scale-equivariant layer, we create a scale-equivariant U-Net for
medical image segmentation and compare it with a non-scale-equivariant baseline
method. Our experiments demonstrate the effectiveness of the proposed method in
achieving scale-equivariance for 3D medical image analysis. We publish our code
at https://github.com/wimmerth/scale-equivariant-3d-convnet for further
research and application.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)が画像内の位置に関係なく物体を認識する能力は、畳み込み操作の翻訳等価性に起因する。
群同値 cnn はこの同値を入力の他の変換に移す。
異なるスケールのオブジェクトやオブジェクトに適切に対処することは困難であり、下層のオブジェクトサイズや画像の解像度など、さまざまな理由によりスケールが変化する可能性がある。
本稿では,3次元cnnにおけるスケール等価性を保証する3次元データのためのスケール同変畳み込みネットワーク層を提案する。
スケール平等は、それぞれの可能なスケールを別々に学ぶことの負担を軽減し、ニューラルネットワークがより高いレベルの学習目標に集中できるようにすることで、より良い結果とデータ効率が向上する。
本稿では,2次元領域におけるスケール不変ニューラルネットワークに関する理論的基礎と科学的研究の概要について述べる。
次に、概念を2dから3次元空間に移し、3dデータのためのスケール同変畳み込み層を作成する。
提案するスケール同変層を用いて医用画像セグメンテーションのためのスケール同変u-netを作成し,非スケール同変ベースライン法と比較する。
本研究では,3次元医用画像解析におけるスケール等価性を実現するための提案手法の有効性を実証する。
さらなる研究とアプリケーションのために、コードはhttps://github.com/wimmerth/scale-equivariant-3d-convnetで公開しています。
関連論文リスト
- Improved Generalization of Weight Space Networks via Augmentations [53.87011906358727]
深度重み空間(DWS)における学習は新たな研究方向であり、2次元および3次元神経場(INRs, NeRFs)への応用
我々は、この過度な適合の理由を実証的に分析し、主要な理由は、DWSデータセットの多様性の欠如であることがわかった。
そこで本研究では,重み空間におけるデータ拡張戦略について検討し,重み空間に適応したMixUp法を提案する。
論文 参考訳(メタデータ) (2024-02-06T15:34:44Z) - Scale-Equivariant UNet for Histopathology Image Segmentation [1.213915839836187]
畳み込みニューラルネットワーク(CNN)は、特定のスケールでそのような画像で訓練されたが、異なるスケールのものに一般化することができない。
本稿では,スケール空間理論に基づく画像分割のためのスケール・エクイバティブUNet(SEUNet)を提案する。
論文 参考訳(メタデータ) (2023-04-10T14:03:08Z) - Leveraging SO(3)-steerable convolutions for pose-robust semantic segmentation in 3D medical data [2.207533492015563]
球面調和に基づく同変ボクセル畳み込みを用いたセグメンテーションネットワークを新たに提案する。
これらのネットワークは、トレーニング中に見えないデータポーズに対して堅牢であり、トレーニング中にローテーションベースのデータ拡張を必要としない。
MRI脳腫瘍におけるセグメンテーション性能と健常な脳構造セグメンテーション課題について検討した。
論文 参考訳(メタデータ) (2023-03-01T09:27:08Z) - Decomposing 3D Neuroimaging into 2+1D Processing for Schizophrenia
Recognition [25.80846093248797]
我々は2+1Dフレームワークで3Dデータを処理し、巨大なImageNetデータセット上に事前トレーニングされた強力な2D畳み込みニューラルネットワーク(CNN)ネットワークを利用して3Dニューロイメージング認識を実現することを提案する。
特に3次元磁気共鳴イメージング(MRI)の計測値は、隣接するボクセル位置に応じて2次元スライスに分解される。
グローバルプーリングは、アクティベーションパターンが機能マップ上にわずかに分散されているため、冗長な情報を除去するために適用される。
2次元CNNモデルにより処理されていない3次元の文脈情報を集約するために,チャネルワイドおよびスライスワイズ畳み込みを提案する。
論文 参考訳(メタデータ) (2022-11-21T15:22:59Z) - Moving Frame Net: SE(3)-Equivariant Network for Volumes [0.0]
移動フレームアプローチに基づく画像データのための回転・変換同変ニューラルネットワークを提案する。
入力段階において、移動フレームの計算を1つに減らし、そのアプローチを大幅に改善する。
我々の訓練されたモデルは、MedMNIST3Dの試験されたデータセットの大部分の医療ボリューム分類において、ベンチマークを上回ります。
論文 参考訳(メタデータ) (2022-11-07T10:25:38Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - TSGCNet: Discriminative Geometric Feature Learning with Two-Stream
GraphConvolutional Network for 3D Dental Model Segmentation [141.2690520327948]
2流グラフ畳み込みネットワーク(TSGCNet)を提案し、異なる幾何学的特性から多視点情報を学ぶ。
3次元口腔内スキャナーで得られた歯科モデルのリアルタイムデータセットを用いてTSGCNetの評価を行った。
論文 参考訳(メタデータ) (2020-12-26T08:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。